女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一塊晶圓等于一顆芯片!全球最大WSE-2處理器發布!7nm,面積達826 mm2

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2021-04-23 09:00 ? 次閱讀

不知大家是否還記得去年英偉達發布的A100 GPU,作為V100推出三年后的又一大計算卡,其性能較V100提升了20倍,英偉達更是稱其為最大的7nm芯片,面積達到826 mm2。而初創公司Cerebras則在近日發布了第二代Wafer Scale Engine(WSE-2)芯片,奪下了7nm下面積最大芯片的寶座。

WSE-2 芯片/ Cerebras


從2015年到2020年,全球在訓練大型模型上的計算已經到了30萬倍,AI的限制更像是運算能力的限制,而不單單只是應用和創意。驗證一個猜想和訓練一個新模型可能會花上數周乃至數月的時間,Cerebras的WSE-2旨在解決這些影響創新速度的問題。

一塊晶圓 =一個芯片

WSE-2與A100面積大小對比 / Cerebras


WSE-2從上一代的16nm工藝替換為7nm,盡管面積不變,但新制程的密度優勢使其晶體管數量翻倍,達到了26000億,AI核心數更是增加至85萬個。Cerebras是在參數簡介上直接對標英偉達的A100,與826 mm2 的A100相比,46225 mm2的WSE-2是前者的56倍。WSE-2片上內存為40GB,是A100的千倍,內存帶寬更是做到A100的上萬倍。WSE內含85萬個專為AI應用優化的稀疏線性代數計算(SLAC)核心,非常適合神經網絡運算。

Cerebras也指出內存也是計算中重要的一環。就拿上面提到的A100來說,A100只有40MB的L2 cache,卻有著40GB的HBM2內存,但這種圖形處理器的缺點就在于這種顯存往往是片外內存,而且速度太慢,延遲過高。而WSE-2的40GB內存則是均勻分布在AI核心上,且帶寬可以達到20PB/s。

其實早在去年的HotChips大會上,Cerebras就已經透露過這個85萬AI核的新處理器,但由于一些延誤,他們沒法及時在去年發布。Cerebras聯合創始人Andrew Feldman在近期采訪中提到,與客戶合作了一年之后,他們汲取了一些經驗教訓,并將其整合進了新的AI核心中去,因此這一推遲很可能是由于對AI核心微架構的改進。

以往一個晶圓需要切割成多個芯片,經過封裝后再作為處理器上市售賣。而Cerebras的解決方案是晶圓級集成技術,直接利用一個晶圓的最大面積來生產單一芯片,不過考慮到目前矩形芯片依然是效率最高的選擇,自然不可能直接拿整個圓形晶圓來制造芯片,Cerebras也從一塊晶圓中選取了最大的正方形。雖然從12英寸晶圓的面積來看,制造一個WSE-2只用到了2/3的面積,但與芯片的售價相比,哪怕這些邊角料被浪費,損失也只是滄海一粟而已。要知道Cerebras賣給匹茨堡超算中心的兩臺基于WSE-1的系統,可是從中獲利近500萬美元。

基于WSE-2的AI計算平臺

但更強大的芯片放在一個老舊的系統里并非一定能實現全部的性能,反而可能會凸顯出原有系統的瓶頸,比如通信結構、芯片I/O、電源和散熱等等。這就像是拿法拉利的引擎放在大眾車里,也跑不出前者的速度一樣。

CS-2散熱系統 / Cerebras


基于WSE-2、Cerebras的系統以及軟件平臺,Cerebras也推出了新一代深度學習系統CS-2,來突破系統上的限制。這么強大的性能自然需要強大的供電,CS-2采用了9+3的冗余供電配置來驅動WSE-2。但這樣的供電自然也面臨著散熱上的挑戰,Cerebras在CS-2內部運用了一套水冷散熱系統,用水冷來對WSE-2散熱,再由風冷來降低水溫。與此同時,CS-2的空間占用并不大,這個26英寸高的機器僅僅占用15U的機架空間,雖然大于英偉達的HGX A100系統,但考慮到性能的提升,這點空間占用還是可以接受的。

CS-2 系統/ Cerebras


據Cerebras透露,WSE-2和CS-2都將于今年第三季度推出,而CS-2的價格也將從CS-1的2到3百萬美元漲到“幾百萬”美元的不具體數字。

小結

盡管Cerebras的WSE-2是一個性能怪獸,但它的應用面并沒有A100那么廣,更像是面向小眾市場。就拿WSE-1的一些客戶來說,多數在進行一些生物及醫學研究,比如癌癥治療、藥物發現等,且多用于超算中心與國家實驗室,比如上面提到的匹茨堡超算中心和阿貢國家實驗室。而英偉達的A100則可以用于各種AI和HPC應用,這也是Cerebras目前的解決方案沒有突破的,但考慮到Cerebras的定位也不是為了做到全面覆蓋,專注于一個市場反而是Cerebras能做到如此優秀的原因所在。

其實最值得去突破的仍是這種晶圓級集成的技術,固然芯片設計廠商希望從單一晶圓中獲取更多的芯片,獲取更高的利潤,但這種純粹追求性能的芯片反而適合如今不少Power-hungry的應用。話雖如此,實現這類芯片的良率同樣是一大挑戰,并不是每家公司都像Cerebras一樣在WSE-2上實現100%的良率的。

本文由電子發燒友原創,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱[email protected]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19819

    瀏覽量

    233685
  • 芯片
    +關注

    關注

    459

    文章

    52243

    瀏覽量

    436777
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    國民技術能否開展個M7處理器的試用活動。

    國民技術最近推出了M7處理器,看起來能力很強,電子發燒友能不能聯合國民技術開展個M7使用的活動,讓大家了解下M7核的國民技術。
    發表于 05-20 22:04

    扇出型級封裝技術的工藝流程

    上 。這種創新的封裝方式自蘋果A10處理器采用后,在節約主板表面面積方面成效顯著。根據線路和焊腳與芯片尺寸的關系,WLP分為Fanin WLP(線路和焊腳限定在芯片尺寸以內)和Fano
    的頭像 發表于 05-14 11:08 ?472次閱讀
    扇出型<b class='flag-5'>晶</b><b class='flag-5'>圓</b>級封裝技術的工藝流程

    基于龍芯2K0300處理器 龍芯中科攜手正點原子發布龍芯ATK-DL2K0300B開發板

    龍芯中科攜手正點原子發布龍芯ATK-DL2K0300B開發板。該開發板為正點原子發布的首款龍芯開發板,為基于龍芯2K0300處理器打造,是
    的頭像 發表于 02-25 15:29 ?719次閱讀
    基于龍芯<b class='flag-5'>2</b>K0300<b class='flag-5'>處理器</b> 龍芯中科攜手正點原子<b class='flag-5'>發布</b>龍芯ATK-DL<b class='flag-5'>2</b>K0300B開發板

    RK3126處理器:高效四核Cortex-A7多媒體處理平臺

    RK3126是款集成了四核Cortex-A7 CPU和Mali-400MP2 GPU的高性能多媒體處理器,專為滿足現代智能設備對高效能、低功耗的需求而設計。 在CPU方面,RK312
    的頭像 發表于 02-08 18:11 ?1259次閱讀

    RK3128處理器:高效四核Cortex-A7多媒體解決方案

    Cortex-A7處理器,頻率高達1.2GHz,提供了流暢的多任務處理能力,確保設備在各種應用場景下都能保持出色的響應速度和穩定性。 GPU方面,RK3128配備了Mali-400MP2
    的頭像 發表于 02-08 18:08 ?1213次閱讀

    RV1109處理器概述

    RV1109處理器款集成了先進技術的高性能芯片,其主要特性彰顯了在多個領域的強大應用能力。 該處理器搭載了雙核設計,結合了ARM Cortex-A
    的頭像 發表于 02-08 17:04 ?1248次閱讀

    MTK8786_MT8786處理器性能參數_MTK聯發科安卓核心板方案

    聯發科的MT8786處理器采用了靈活的2+6架構,配備2主頻高達2.0GHz的Cortex-A75大核心和6主頻為1.8GHz的Cort
    的頭像 發表于 01-09 20:18 ?1945次閱讀
    MTK8786_MT8786<b class='flag-5'>處理器</b>性能參數_MTK聯發科安卓核心板方案

    TPS65911A 66AK2G12處理器用戶指南

    電子發燒友網站提供《TPS65911A 66AK2G12處理器用戶指南.pdf》資料免費下載
    發表于 01-02 16:11 ?4次下載
    TPS65911A 66AK<b class='flag-5'>2</b>G12<b class='flag-5'>處理器</b>用戶指南

    TPS659118 66AK2G02處理器用戶指南

    電子發燒友網站提供《TPS659118 66AK2G02處理器用戶指南.pdf》資料免費下載
    發表于 12-23 14:40 ?0次下載
    TPS659118 66AK<b class='flag-5'>2</b>G02<b class='flag-5'>處理器</b>用戶指南

    一顆芯片面積頂4H200,博通推出3.5D XDSiP封裝平臺

    平方毫米的3D堆疊硅晶片和12個HBM模塊集成到個系統級封裝中。這是什么概念? ? 目前手機移動端的旗艦處理器驍龍8Elite核心面積是124.1平方毫米;英偉H200核心
    的頭像 發表于 12-10 09:15 ?2616次閱讀
    <b class='flag-5'>一顆</b><b class='flag-5'>芯片面積</b>頂4<b class='flag-5'>顆</b>H200,博通推出3.5D XDSiP封裝平臺

    所謂的7nm芯片上沒有個圖形是7nm

    最近網上因為光刻機的事情,網上又是陣熱鬧。好多人又開始討論起28nm/7nm的事情了有意無意之間,我也看了不少網上關于國產自主7nm工藝的文章。不過這些文章里更多是抒情和遐想,卻很少
    的頭像 發表于 10-08 17:12 ?743次閱讀
    所謂的<b class='flag-5'>7nm</b><b class='flag-5'>芯片</b>上沒有<b class='flag-5'>一</b>個圖形是<b class='flag-5'>7nm</b>的

    基于全志V853處理器的智能輔助駕駛算法介紹

    全志V853處理器,是專為智慧視覺領域設計的AI處理器,配備了高效的NPU算力和豐富的外設接口,能夠提供穩定的AI邊緣計算支持;同時,基于V853處理器性能優勢,全志還為客戶提供了
    的頭像 發表于 09-14 09:23 ?1680次閱讀
    基于全志V853<b class='flag-5'>處理器</b>的智能輔助駕駛算法介紹

    使用TPS6521815 PMIC為NXP i.MX 7處理器供電

    電子發燒友網站提供《使用TPS6521815 PMIC為NXP i.MX 7處理器供電.pdf》資料免費下載
    發表于 09-13 09:40 ?0次下載
    使用TPS6521815 PMIC為NXP i.MX <b class='flag-5'>7</b><b class='flag-5'>處理器</b>供電

    高通驍龍6 Gen 3處理器發布

    高通公司近日正式推出了驍龍6 Gen 3處理器,這款芯片采用先進的三星4nm工藝打造,代號為SM6475-AB,標志著中端處理器市場的新
    的頭像 發表于 09-04 15:43 ?1670次閱讀

    廣東龍芯發布2K0300蜂鳥板,今日正式發售

    的產品集成和靈活擴展。其中,核心板板載一顆LS2K0300處理器(內封一顆主頻為1GHz的LS264處理器核心)、512MB的DDR4內存和
    發表于 06-20 10:00