近日,?Google?AI負責人Jeff?Dean發推文表示,在最新一輪MLPerf基準測試中,Google新的ML超級計算機和最新的Tensor處理單元(TPU)芯片,打破了6項MLPerf基準測試記錄。
這6個模型分別是用于排名與推薦的DLRM模型;常用于自然語言處理的Transformer;還有Google搜尋所使用的BERT模型;廣泛用于圖像分類的ResNet-50模型;可在移動設備上執行的輕量級物體偵測模型SSD;以及圖像分割模型Mask?R-CNN。
谷歌在博客中披露,該超級計算機包括4096個TPU?V3芯片和CPU數百個主機上的,并提供超過430?PFLOPs的峰值性能。較前一代TPU?v3相比,擁有兩倍的矩陣乘法效能,而且存儲器頻寬大幅增加,內部相連技術也獲得改善,利用MLPerf基準測試比較TPU?v4和TPU?v3,TPU?v4平均效能提升2.7倍,最大的效能差異是用于訓練Mask?R-CNN,TPU?v4的效能是TPU?v3的3.7倍。
Google使用TensorFlow、JAX和Lingvo中的機器學習模型實作,從零開始訓練Transformer、SSD、BERT以及ResNet-50模型,訓練時間皆在30秒之內。而在2015年時,即便用最快的硬件加速器,訓練其中一種模型,都需要花費3個多星期,現今相當于把相同模型的訓練速度提升5個數量級。
責任編輯:pj
-
芯片
+關注
關注
460文章
52509瀏覽量
440855 -
Google
+關注
關注
5文章
1789瀏覽量
59031 -
AI
+關注
關注
88文章
35146瀏覽量
279828 -
MLPerf
+關注
關注
0文章
36瀏覽量
824
發布評論請先 登錄
CEO被撤職后,美國激光雷達大廠 Luminar 開啟新一輪裁員
新一輪的工業“智變”
1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現卓越
知行科技完成新一輪超2億元融資
螞蟻集團宣布新一輪組織架構調整
MLCommons推出AI基準測試0.5版
慶虹電子獲新一輪融資,比亞迪參與投資
榮耀迎來新一輪投資,中國電信、中金資本等加入
字節跳動開啟新一輪股權回購
OpenAI新一輪融資66億美元,鞏固AI領先地位
浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

評論