企業每天都會產生大量互連的結構化、半結構化和非結構化數據。大數據分析是檢查這些數據以發現信息(例如隱藏模式、相關性、市場趨勢和客戶偏好)的通常復雜的過程,這些信息可以幫助組織做出明智的業務決策。
AMD 一直與我們的合作伙伴生態系統合作,為大數據分析創建最佳基礎架構解決方案。這包括流行的 Apache? Hadoop? 框架,該框架有助于對大型數據集進行分布式處理。我們有幾個客戶已經在基于 AMD EPYC? 的服務器上實施了大數據分析部署,因為它們通過行業標準基準測試證明了其持續的性能、可擴展性和總擁有成本優勢。
TPC Express Benchmark? HS (TPCx-HS) 是一種流行的行業標準,用于對基于 Hadoop 的大數據分析系統進行基準測試,以技術上嚴格、直接可比和供應商中立的方式進行性能和性價比比較。TPCx-HS 強調硬件和軟件堆棧,包括執行引擎和 Hadoop 文件系統 API 兼容層。TPCx-HS 可以評估廣泛的系統拓撲和實施方法,并產生與大數據和分析硬件和軟件系統高度相關的結果。
今天,AMD EPYC(霄龍)7003 系列處理器在每個比例因子上都主導著性能世界紀錄,如圖 1 和AMD EPYC(霄龍)處理器世界紀錄頁面所示。圖 1 中的結果是使用 Supermicro 集群獲得的。
圖 1:第三代 AMD EPYC 處理器的性能和性價比排名
我還想展示這些結果如何與競爭對手相抗衡。圖 2 顯示基于 AMD EPYC 的系統在 1TB、3TB 和 100TB 時的性價比分別提高了 78%、70% 和 116%。需要注意的是,每個 AMD EPYC-基于服務器的服務器僅包含一個處理器,而其他服務器各包含兩個處理器。這證明了單插槽服務器為您提供最佳解決方案的可行性。
圖 2:CDP 私有云上的 1 倍 AMD EPYC 75F3 TPCx-HS 性能與 2 倍英特爾? 至強? 6262V
TPC Express Benchmark BB (TPCx-BB) 是另一個流行的基于 Hadoop 的大數據系統的基準。該基準測試通過在實體店和在線店的零售商環境中執行 30 個經常執行的分析查詢來衡量硬件和軟件組件的性能。結構化數據的查詢以 SQL 表示,半結構化和非結構化數據的查詢以機器學習算法表示。SQL 查詢可以使用 Hive 或 Spark,而機器學習算法使用機器學習庫、用戶定義的函數和過程程序。如圖 3 所示,基于 AMD EPYC 的單插槽系統以 3000GB 的比例因子提供了最佳結果。 [6] 由 AMD EPYC 7763處理器驅動的 Dell EMC PowerEdge 7515 服務器集群以 487.5 美元/燒烤每分鐘的價格提供了 1,533.13 次燒烤。
圖 3:TPCx-BB 基準測試中的單路 AMD EPYC 7763 性能
我還想提一下用于 IoT 網關系統的 TPC Express Benchmark IoT (TPCx-IOT)。隨著越來越多的智能設備連接到互聯網,該基準在當今的互聯世界中非常重要。TPCx-IoT 是業界第一個允許直接比較物聯網網關不同軟件和硬件解決方案的基準。網關系統位于邊緣架構和后端數據中心之間,它們在其中執行數據聚合、實時分析和持久存儲等功能。TPCx-IoT 專門設計用于為商用系統提供可驗證的性能、性價比和可用性指標,這些系統通常在運行實時分析查詢時從大量設備中攝取大量數據。工作負載代表在商用硬件和軟件平臺上運行的典型 IoT 網關活動。我很高興地說,基于 AMD EPYC 的系統提供了一流的性能和性價比,如圖 4 所示。
圖 4:基于 AMD EPYC 的系統在物聯網工作負載上提供頂級性能和性價比
這些結果表明,基于 AMD EPYC 的服務器是您的大數據分析部署的理想選擇。
審核編輯:郭婷
-
amd
+關注
關注
25文章
5586瀏覽量
136327 -
物聯網
+關注
關注
2930文章
46224瀏覽量
392266 -
服務器
+關注
關注
13文章
9793瀏覽量
87935
發布評論請先 登錄
第三代半導體的優勢和應用領域
第三代半導體器件封裝:挑戰與機遇并存

EE-220:將外部存儲器與第三代SHARC處理器和并行端口配合使用

第三代半導體對防震基座需求前景?

第三代半導體產業高速發展
江西薩瑞微榮獲&quot;2024全國第三代半導體制造最佳新銳企業&quot;稱號

評論