Meta取消了大規(guī)模推出內(nèi)部推理芯片的計(jì)劃,并開始著手開發(fā)能夠執(zhí)行訓(xùn)練和推理的芯片。
據(jù)悉,Meta之前發(fā)展AI業(yè)務(wù)時(shí),一直沒有接受使用GPU,相反,直到去年,Meta都在主要使用CPU隊(duì)列運(yùn)行人工智能工作負(fù)載,這也是Meta在AI進(jìn)程上落后對(duì)手的關(guān)鍵原因之一。目前,Meta內(nèi)部已開始計(jì)劃開發(fā)一款新型芯片,類似GPU,既能訓(xùn)練AI模型,又能進(jìn)行推理,該項(xiàng)目將于2025年左右完成。
Meta Platforms今天分享了其數(shù)據(jù)中心項(xiàng)目的新細(xì)節(jié),以更好地支持人工智能工作,包括內(nèi)部開發(fā)的定制芯片“系列”。
以下是 MTIA v1 芯片的基本規(guī)格:基于一個(gè)雙核 RISC-V 處理元件,包含25 瓦芯片和 35 瓦雙 M.2 外圍卡。
因?yàn)樗堑皖l率的,MTIA v1 芯片消耗的功率也相當(dāng)?shù)停⑶也捎?7 納米工藝實(shí)現(xiàn)意味著該芯片足夠小,可以運(yùn)行得非常酷,而無需采用臺(tái)積電最先進(jìn)的工藝。臺(tái)積電的從 5 納米到 3 納米不這些更昂貴的工藝,可以留到以后再使用。就像谷歌的TPU那樣,當(dāng)工藝更便宜時(shí)使用在新一代設(shè)備上進(jìn)行訓(xùn)練和推理。
MTIA v1 推理芯片有一個(gè)由 64 個(gè)處理元件組成的網(wǎng)格,這些處理元件周圍環(huán)繞著 128 MB 的 SRAM 內(nèi)存,可用作主存儲(chǔ)器或前端有 16 個(gè)低功耗 DDR5 (LPDDR5) 內(nèi)存控制器的高速緩存。
這種 LPDDR5 內(nèi)存用于筆記本電腦,也用于 Nvidia 即將推出的 Grace Arm 服務(wù)器CPU。這 16 個(gè) LPDDR5 內(nèi)存通道可以提供高達(dá) 64 GB 的外部?jī)?nèi)存。
這 64 個(gè)處理元素基于一對(duì) RISC-V 內(nèi)核,一個(gè)是普通的,另一個(gè)是帶有矢量數(shù)學(xué)擴(kuò)展的。每個(gè)處理元件都有 128 KB 的本地內(nèi)存和固定功能單元,用于執(zhí)行 FP16 和 INT8 數(shù)學(xué)運(yùn)算、處理非線性函數(shù)和移動(dòng)數(shù)據(jù)。
這是 MTIA v1 板的外觀
這是 MTIA 服務(wù)器設(shè)計(jì)中的巧妙之處。Yosemite 服務(wù)器中有一個(gè) PCI-Express 交換機(jī)的葉/脊網(wǎng)絡(luò),它不僅可以讓 MTIA 連接到主機(jī),還可以相互連接,并連接到 96 GB 的主機(jī) DRAM,必要時(shí)可以存儲(chǔ)更大的嵌入。(就像 Nvidia 打算對(duì) Grace-Hopper 做的那樣。)
Meta一系列博文中表示,它在 2020 年設(shè)計(jì)了第一代芯片,作為元訓(xùn)練和推理加速器 (MTIA) 計(jì)劃的一部分。目的是提高它用于在新聞提要中投放廣告和其他內(nèi)容的推薦模型的效率。
第一個(gè) MTIA 芯片專門專注于推理AI 的過程,在該過程中,根據(jù)大量數(shù)據(jù)訓(xùn)練的算法會(huì)判斷是否將舞蹈視頻或貓表情包顯示為用戶提要中的下一個(gè)帖子。Meta 的軟件工程師 Joel Coburn 在介紹新芯片時(shí)表示,Meta 最初將圖形處理單元或 GPU 用于推理任務(wù),但發(fā)現(xiàn)它們不太適合推理工作。
“盡管對(duì)軟件進(jìn)行了重大優(yōu)化,但它們對(duì)于真實(shí)模型的效率仍然很低。這使得它們?cè)趯?shí)踐中部署起來具有挑戰(zhàn)性且成本高昂,”Coburn 說。“這就是我們需要 MTIA 的原因。”
Meta 發(fā)言人拒絕就新芯片的部署時(shí)間表發(fā)表評(píng)論,也拒絕詳細(xì)說明開發(fā)可以訓(xùn)練模型的芯片的計(jì)劃。
Meta 還更新了圍繞更現(xiàn)代的面向 AI 的網(wǎng)絡(luò)和冷卻系統(tǒng)重新設(shè)計(jì)其數(shù)據(jù)中心的計(jì)劃,并表示將在今年破土動(dòng)工其首個(gè)此類設(shè)施。一名員工在解釋這些變化的視頻中表示,新設(shè)計(jì)的成本將降低 31%,而且建造速度可能是公司目前數(shù)據(jù)中心的兩倍。
Meta 表示,它擁有一個(gè)人工智能系統(tǒng)來幫助其工程師創(chuàng)建計(jì)算機(jī)代碼,類似于微軟公司、亞馬遜公司和 Alphabet 公司提供的工具。
值得注意的是,前不久,Meta從英國人工智能(AI)芯片公司Graphcore挖來了一個(gè)團(tuán)隊(duì),該團(tuán)隊(duì)此前在挪威奧斯陸工作,直到去年年底還在Graphcore開發(fā)AI網(wǎng)絡(luò)技術(shù)。
據(jù)悉,該團(tuán)隊(duì)共有10人,他們?cè)贕raphcore工作到去年12或今年1月,隨后在今年2月或3月加入Meta。在回應(yīng)媒體置評(píng)要求時(shí),Meta發(fā)言人Jon Carvill證實(shí),該公司確實(shí)招聘了上述團(tuán)隊(duì)。Carvill表示:“最近,我們?cè)趭W斯陸迎接了一些高度專業(yè)化的工程師加入Meta的基礎(chǔ)設(shè)施團(tuán)隊(duì)。他們帶來了超級(jí)計(jì)算機(jī)系統(tǒng)設(shè)計(jì)和開發(fā)方面的深厚專業(yè)知識(shí),以支持Meta數(shù)據(jù)中心大規(guī)模的AI和機(jī)器學(xué)習(xí)。”Carvill拒絕透露這些員工將在Meta從事的具體工作。
自去年11月發(fā)布以來,ChatGPT掀起了一股科技熱潮,幾乎所有科技巨頭都參與到了生成式AI領(lǐng)域,而Meta目前在該領(lǐng)域落后于微軟和谷歌等競(jìng)爭(zhēng)對(duì)手。Meta開發(fā)新AI芯片是一個(gè)重要舉措,表明該公司正加大投資,提升其人工智能技術(shù)的競(jìng)爭(zhēng)力。
審核編輯:劉清
-
ARM芯片
+關(guān)注
關(guān)注
1文章
127瀏覽量
21934 -
TPU
+關(guān)注
關(guān)注
0文章
151瀏覽量
21077 -
RISC-V
+關(guān)注
關(guān)注
46文章
2479瀏覽量
48260 -
LPDDR5
+關(guān)注
關(guān)注
2文章
89瀏覽量
12448
原文標(biāo)題:Meta自研RISC-V AI推理芯片
文章出處:【微信號(hào):ICViews,微信公眾號(hào):半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
大象機(jī)器人×進(jìn)迭時(shí)空聯(lián)合發(fā)布全球首款RISC-V全棧開源小六軸機(jī)械臂

AI SoC# 奕斯偉EIC7700 全球首款基于RISC-V架構(gòu)的邊緣計(jì)算SoC芯片

端側(cè)AI、數(shù)據(jù)中心,RISC-V已“上桌”
首款RISC-V架構(gòu)服務(wù)器,助力行業(yè)精準(zhǔn)適配AI場(chǎng)景

關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫?
RISC-V擁有巨大市場(chǎng)潛力的原因
RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

評(píng)論