女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達超級芯片的真正殺手锏,C2C互聯技術

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-08-16 00:12 ? 次閱讀

電子發燒友網報道(文/周凱揚)英偉達于今年發布了新一代的GH200 Grace Hopper硬件平臺,預示著其發展HPC與AI的重要路線邁進了新階段。GH200將用于應對世界上最復雜的生成式AI負載,涵蓋大語言模型、推薦系統和矢量數據庫等應用,且英偉達依然為GH200準備了不同的配置選項,無疑這一芯片很快就會用于各大數據中心和超算中。

NVLink,從片外互聯走向片內互聯

或許在多數人眼中,GH200不過是新一代Grace CPU和Hopper GPU結合的又一新產品,但這必然不是英偉達追求的“1+1=2”效果。事實上,GH200是象征著英偉達在芯片互聯技術先進設計水平的集大成者。

在英偉達的第四代NVLink技術和第三代NVSwitch技術下,創造一個256個GH200連接在一起的系統也不在話下。但這樣的片外互聯技術并不算罕見,市面上也有不少初創公司的AI芯片可以做到類似或者更夸張的擴展性。

然而在片內芯片互聯上,NVLink-C2C這一互聯技術確實達到了新的高度。NVLink-C2C是英偉達專為其superchip系列打造的內存一致、高帶寬、低延遲互聯技術。也是其實現高達900GB/s總帶寬的關鍵所在。900GB/s的帶寬是什么概念呢?與現代AI/HPC加速器常用的16路的PCIe 5.0相比,還要快上6倍。

NVLink-C2C的優勢

NVLink-C2C的第一大優勢就是其內存一致性,這不僅提高了開發者的效率、芯片性能,還提高了GPU可以訪問的內存量。在這一互聯技術的支持下,如今CPU、GPU線程都可以并行訪問CPU和GPU各自的內存,無需頁遷移,所以開發者可以專心于優化算法本身,而不是內存管理。

其次就是900GB/s的帶寬了,有了NVLink-C2C,應用程序可以直接用滿GPU的內存,再以超高的帶寬直接調用Grace CPU的內存。畢竟即便是最新的HBM3e版GH200,也只有144GB的內存,而Grace CPU可以支持到最高480GB的LPDDR5X內存。甚至在NVSwitch的支持下,可以高速訪問整個系統中最高達144TB的內存。

如此一來在GPT這樣的LLM模型中,可用的內存也就變多了。這對于batch size增加后,推理所需內存數增加的生成式AI來說至關重要。相比過去x86 CPU+PCIe 5.0 H100的搭配組合,GH200在更大的batch size下推理速度有著數倍的提升。

英偉達也對高帶寬在HPC加速上的優勢進行了解讀,以ABINIT的標準執行時間為例,ABINIT是一個用于計算材料光學機械、振動等特性的模擬軟件。以只用x86 CPU的執行時間作為標準,在x86 CPU與Hopper GPU的結合下,超高性能的Hopper GPU極大地縮短了執行時間。

然而在CPU與GPU之間的傳輸開銷下,這一組合最終只能做到快上1.16倍的優勢。而如果是使用Grace Hopper方案的話,在NVLink-C2C的超大帶寬下,CPU與GPU之間的傳輸開銷迅速縮減,最終實現了縮短4.25倍的執行時間。

寫在最后

英偉達會走上自研CPU和Superchip的路線其實并不令人意外,為CPU與GPU之間打通一個更快的接口一直是英偉達的努力方向之一。此前由于x86的CPU設計主要還是有英特爾AMD兩家廠商完成,而Grace這樣的自研Arm芯片則沒了設計限制,可以摻入英偉達的各種定制化開發。

NVLink-C2C也為市面上其他的AI芯片帶來了更大的挑戰,畢竟英偉達在性能、軟件生態上已經處于領先地位,又有著如此高效的互聯技術。可以預見未來其他廠商也會在芯片互聯、高速接口等領域發力,否則很難與英偉達同臺競爭。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3912

    瀏覽量

    93045
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    解決方案在英偉 GPU和英偉 CUDA-X庫上所實現的加速 基于英偉 GB200 Grac
    發表于 03-19 17:59 ?192次閱讀

    英偉市值一夜蒸發近2萬億 英偉股價下跌超8%

    財年第四財季和全財年業績數據上看,2025財年第四財季及全年的營收和利潤都實現了大幅增長,大家特別關注的數據中心業務也是業績增長的核心動力,展現出英偉在AI領域的強大實力。而且英偉
    的頭像 發表于 03-04 10:19 ?489次閱讀

    英偉帶來Reflex 2低延遲技術

    在 2025 年國際消費電子展(CES 2025)上,英偉不僅推出了備受矚目的 RTX 50 系列顯卡,還帶來了一項名為 Reflex 2 的低延遲技術,引發行業廣泛關注。 Refl
    的頭像 發表于 02-05 15:15 ?779次閱讀

    英偉推出GB200 NVL4芯片!液冷UQD快接頭崛起

    中,英偉推出了全新的硬件產品——GB200 NVL4超級芯片。該芯片展現出了較為出色的性能表現,在業界引起了廣泛關注,并預計于2025年下
    的頭像 發表于 01-10 16:58 ?822次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>推出GB200 NVL4<b class='flag-5'>芯片</b>!液冷UQD快接頭崛起

    英偉加速認證三星新型AI存儲芯片

    近日,英偉首席執行官黃仁勛近日在接受采訪時透露,英偉正在全力加速對三星最新推出的AI存儲芯片——HBM3E的認證進程。這一舉措標志著
    的頭像 發表于 11-26 10:22 ?507次閱讀

    英偉市值飆升,逼近蘋果

    近日,隨著人工智能技術的持續繁榮,英偉公司作為AI芯片生產的領軍者,其市值實現了驚人的飛躍。截至美國當地時間21日,英偉
    的頭像 發表于 10-23 09:31 ?548次閱讀

    英偉Blackwell芯片量產加速,Q4預計出貨45萬片

    摩根士丹利最新發布的報告揭示了英偉在AI芯片領域的重大進展,其最新力作Blackwell芯片已成功步入量產階段,預示著英偉
    的頭像 發表于 09-27 15:02 ?1113次閱讀

    英偉高管解讀Q2財報 但是英偉市值暴跌1.4萬億元

    英偉正式發布了2025財年第二季度報告,英偉公司在Q2營收達到了300.4億美元,這個營收超過了市場預期的287億美元,同比增長122%
    的頭像 發表于 08-30 13:03 ?978次閱讀

    英偉Blackwell架構揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業資訊
    jf_02331860
    發布于 :2024年08月26日 10:58:09

    AI芯片巨頭英偉漲超4% 英偉市值暴增7500億

    誰是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉肯定有一席之地,特別是現在全球資本市場動蕩之際,業界分析師多認為英偉是最佳“反彈股”
    的頭像 發表于 08-13 15:33 ?1353次閱讀

    3萬-4萬美元/顆,英偉最新AI芯片曝設計缺陷、延遲出貨

    Q1。 隨后,SemiAnalysis在最新研報中剖析了英偉Blackwell B200芯片技術挑戰,主要在合封方面。一顆Blackwell B200
    的頭像 發表于 08-06 00:19 ?4449次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    英偉帶領芯片股飆升 英偉大漲4.76%

    英偉不愧是總龍頭,大漲4.76%。英偉帶領芯片股飆升;甚至可以說是帶動了美國股市上漲,在當地時間22日,科技股反彈,帶動整體行情走高。美
    的頭像 發表于 07-23 16:26 ?509次閱讀

    英偉Blackwell芯片已投產,預告未來AI芯片發展

    英偉創始人兼CEO黃仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產。這款芯片英偉
    的頭像 發表于 06-04 09:23 ?2185次閱讀