女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta第二代自研AI芯片出世,性能提升三倍以上

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2024-04-15 09:25 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/周凱揚)不久前,Meta宣布將花費150億美元,購置60多萬塊GPU,而這還沒算上系統(tǒng)成本。就當(dāng)大家以為Meta打算All In GPU之際,Meta放出了下一代MTIA AI芯片,MTIA v2。

基于5nm打造,性能三倍以上

相較上一代MTIA v1,新的MTIA v2的工藝從臺積電的7nm換成了臺積電5nm,芯片主頻也從800MHz提升至1.35GHz。得益于芯片工藝的改進,即便晶體管數(shù)量大幅增加,其芯片面積僅增加了12%。

圖片

MTIA v2芯片 / Meta
MTIA v2的性能提升主要體現(xiàn)在算力上,根據(jù)Meta給出的數(shù)據(jù)其GEMM算力達到354TFLOPS/s(INT8),SIMD算力達到11.06TFLOPS/s(INT8),相較上一代均提升了3倍以上。在接口上,MTIA v2也從8xPCIe 4.0升級至8x PCIe 5.0,帶寬翻倍。
算力的提升除了歸功于工藝的升級外,很可能也不乏內(nèi)核的升級。結(jié)合晶心科技和Meta合作開發(fā)數(shù)據(jù)中心AI處理器的新聞來看,MTIA v1很有可能采用了晶心科技打造的首個商用RISC-V矢量處理器內(nèi)核NX27V,而MTIA v2則很可能用到了最新的AX45MPV內(nèi)核,其三倍以上的性能提升幅度也符合MTIA的算力提升幅度,不過這也只是猜想而已。值得一提的是,與同樣在近期發(fā)布的英特爾Gaudi 3不一樣,MTIA v2在內(nèi)存配置上依舊沒有選擇HBM,片上內(nèi)存只有256MB,片外內(nèi)存選擇了LPDDR5。雖然其片上內(nèi)存擁有2.7TB/s的帶寬,但也注定了MTIA v2很難用于高效率的大模型應(yīng)用。在硬件堆料下,MTIA v2的功耗也已經(jīng)來到了90W,相比MTIA v1的25有著比較大幅度的增加。不過對比H100的能耗比,MTIA v2依然有著比較大的優(yōu)勢。但這也就意味著上一代的服務(wù)器方案可能已經(jīng)不再適用于新的方案,Meta因此為新加速器打造了全新的機柜系統(tǒng)。該系統(tǒng)單個機架由三個底盤構(gòu)成,每個底盤塞進了12塊板卡,每個板卡集成了2個加速器,也就意味著單個機架共有72個MTIA v2加速器,單機柜至少需要6000W的電源供應(yīng)。如果想要實現(xiàn)多機架拓展的話,也可以選擇加入RDMA NIC。Meta表示實現(xiàn)這樣的成績,除了依靠硬件本身的性能提升之外,也離不開他們在優(yōu)化內(nèi)核、編譯器、運行時上的努力。隨著后續(xù)開發(fā)生態(tài)進一步成熟,對模型針對性優(yōu)化的時間會進一步減少,而且未來還有不少空間可以繼續(xù)優(yōu)化芯片的效率。

軟件棧引入新的編譯器

隨著新硬件的發(fā)布,Meta也加大了他們在軟件棧上的開發(fā)力度。作為PyTorch的開發(fā)者,MTIA的軟件棧從設(shè)計之初就做到了PyTorch 2.0的完全集成,也支持TorchDynamo和TorchInductor等新特性。但與此同時,為了簡化應(yīng)用開發(fā)者的工作,為MTIA v1開發(fā)的代碼,也能向下兼容新的MTIA v2硬件。而且Meta表示,因為已經(jīng)將全部的軟件棧集成在新的MTIA芯片內(nèi),在發(fā)布之際,他們已經(jīng)在自己的服務(wù)器上用MTIA v2跑了一段時間了。正因為有這種兼容的軟件棧方案,Meta可在九個月內(nèi)就能讓商用模型運行在16個地區(qū)的服務(wù)器上。為了為全新的MTIA硬件生成更高性能的代碼,Meta還打造了一套新的Triton-MTIA編譯器。Triton是由OpenAI開發(fā)的一套開源語言和編譯器,用于編寫高效的ML計算內(nèi)核。Triton極大地提高了開發(fā)者編寫GPU代碼的速度,但Meta發(fā)現(xiàn)Triton也很適合用于MTIA這樣非GPU的硬件架構(gòu)。

寫在最后

從MTIA v2的性能來看,該加速器應(yīng)該不會替代其購置的大量GPU用在LLM模型上,而是追求算力、內(nèi)存帶寬和內(nèi)存容量的平衡,用于排名和推薦的大模型上。這樣一來大容量的SRAM還是用在GPU上,而Meta最大收入來源的廣告業(yè)務(wù),可以靠MTIA之類的加速器減少成本。Meta除了投資定制AI芯片和下一代GPU這樣的計算芯片外,Meta也強調(diào)他們會繼續(xù)投資內(nèi)存帶寬、網(wǎng)絡(luò)、容量相關(guān)的下一代硬件系統(tǒng)。不僅如此,Meta也在探索增加MTIA的應(yīng)用范圍,包括未來可能支持GenAI的負(fù)載。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Meta
    +關(guān)注

    關(guān)注

    0

    文章

    300

    瀏覽量

    11734
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1968

    瀏覽量

    35684
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    恩智浦推出第二代OrangeBox車規(guī)級開發(fā)平臺

    第二代OrangeBox開發(fā)平臺集成AI功能、后量子加密技術(shù)及內(nèi)置軟件定義網(wǎng)絡(luò)的能力,應(yīng)對快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?209次閱讀

    第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    第二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿足從簡單到復(fù)雜的各種 CXL 應(yīng)用需求
    的頭像 發(fā)表于 04-24 14:52 ?294次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    方正微電子推出第二代車規(guī)主驅(qū)SiC MOS產(chǎn)品

    2025年4月16日,在上海舉行的電關(guān)鍵技術(shù)高峰論壇上,方正微電子副總裁彭建華先生正式發(fā)布了第二代車規(guī)主驅(qū)SiC MOS 1200V 13mΩ產(chǎn)品,性能達到國際頭部領(lǐng)先水平。
    的頭像 發(fā)表于 04-17 17:06 ?478次閱讀

    新品 | 第二代 CoolSiC? MOSFET G2分立器件 1200 V TO-247-4HC高爬電距離

    第一技術(shù)的優(yōu)勢為基礎(chǔ),加快了系統(tǒng)設(shè)計的成本優(yōu)化,實現(xiàn)高效率、緊湊設(shè)計和可靠性。第二代產(chǎn)品在硬開關(guān)工況和軟開關(guān)拓?fù)涞年P(guān)鍵性能指標(biāo)上都有顯著改進,適用于所有常見的交
    的頭像 發(fā)表于 02-08 08:34 ?377次閱讀
    新品 | <b class='flag-5'>第二代</b> CoolSiC? MOSFET G2分立器件 1200 V TO-247-4HC高爬電距離

    簡單認(rèn)識第二代高通3D Sonic傳感器

    目前,已有多款搭載驍龍8至尊版移動平臺的新機陸續(xù)發(fā)布,其中不少機型采用第二代高通3D Sonic超聲波指紋解鎖,為用戶帶來了更為便捷、高效的解鎖體驗。作為高通新一超聲波指紋解鎖解決方案,第二代
    的頭像 發(fā)表于 01-21 10:05 ?693次閱讀

    第二代AMD Versal Premium系列器件的主要應(yīng)用

    隨著數(shù)據(jù)中心工作負(fù)載持續(xù)呈指數(shù)級增長,存儲層也需要同等的性能提升才能跟上步伐。第二代 AMD Versal Premium 系列器件為各種存儲應(yīng)用提供了巨大優(yōu)勢,包括企業(yè)級 SSD、加密/壓縮加速器
    的頭像 發(fā)表于 01-15 14:03 ?467次閱讀

    借助第二代 AMD VERSAL 實現(xiàn)先進醫(yī)療成像

    的類型、速率和數(shù)量。放眼未來,這類設(shè)備中的大部分還需要支持 AI 功能的執(zhí)行和加速,例如感興趣區(qū)域( ROI )選擇、圖像分類和其他 AI 任務(wù)。 第二代 Versal 自適應(yīng) SoC 配備的處理系統(tǒng)可提供比前代至高多出 10
    發(fā)表于 12-04 09:13 ?251次閱讀

    新品 | 第二代 CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-7L封裝

    基礎(chǔ),加快了系統(tǒng)設(shè)計的成本優(yōu)化,實現(xiàn)高效率、緊湊設(shè)計和可靠性。第二代產(chǎn)品在硬開關(guān)工況和軟開關(guān)拓?fù)涞年P(guān)鍵性能指標(biāo)上都有顯著改進,適用于所有常見的交流-直流、直流-直流
    的頭像 發(fā)表于 11-29 01:03 ?383次閱讀
    新品 | <b class='flag-5'>第二代</b> CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-7L封裝

    簡單認(rèn)識第二代高通Oryon CPU

    在不久前的2024驍龍峰會上,備受矚目的新一驍龍旗艦移動平臺——驍龍8至尊版正式發(fā)布。這款以“至尊版”命名的全新平臺也是首個采用第二代高通Oryon CPU的移動平臺。憑借領(lǐng)先的CPU、GPU
    的頭像 發(fā)表于 11-13 09:43 ?960次閱讀

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應(yīng) SoC 平臺旨在面向各種工作負(fù)載提供最高水平系統(tǒng)加速。第二代 Versal
    的頭像 發(fā)表于 11-13 09:27 ?761次閱讀

    一加正式發(fā)布第二代東方屏,獲全球首個DisplayMate A++認(rèn)證

    近日,一加攜手京東方正式發(fā)布第二代東方屏,并宣布將在年度旗艦產(chǎn)品一加 13 中首發(fā)搭載。去年,一加聯(lián)合京東方打造出世界上最好的屏幕——東方屏,這是一次中國屏幕歷史級的突破。本次發(fā)布的第二代東方屏,在
    的頭像 發(fā)表于 10-21 17:32 ?615次閱讀

    AMD第二代Versal自適應(yīng)SoC的主要特色

    AMD 第二代 AMD Versal AI Edge 和 Versal Prime 系列助力 AI 驅(qū)動型和經(jīng)典的嵌入式系統(tǒng)實現(xiàn)單芯片智能性。可在
    的頭像 發(fā)表于 09-18 10:14 ?896次閱讀

    第二代AMD Versal Prime系列自適應(yīng)SoC的亮點

    第二代 Versal Prime 系列自適應(yīng) SoC 是備受期待的 Zynq UltraScale+ MPSoC 產(chǎn)品線的繼任產(chǎn)品,該產(chǎn)品線已廣泛應(yīng)用于廣播與專業(yè)音視頻行業(yè)的設(shè)備中。第二代
    的頭像 發(fā)表于 09-14 15:32 ?801次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Prime系列自適應(yīng)SoC的亮點

    新品 | 采用第二代1200V CoolSiC? MOSFET的集成伺服電機的驅(qū)動器

    TO-263-7封裝的第二代1200VCoolSiCMOSFET。采用IMBG120R040M2H作為相逆變器板的功率開關(guān)。驅(qū)動電路采用了具有米勒鉗位功能的EiceDRI
    的頭像 發(fā)表于 09-05 08:03 ?561次閱讀
    新品 | 采用<b class='flag-5'>第二代</b>1200V CoolSiC? MOSFET的集成伺服電機的驅(qū)動器

    第二代SiC碳化硅MOSFET關(guān)斷損耗Eoff

    第二代SiC碳化硅MOSFET關(guān)斷損耗Eoff
    的頭像 發(fā)表于 06-20 09:53 ?910次閱讀
    <b class='flag-5'>第二代</b>SiC碳化硅MOSFET關(guān)斷損耗Eoff