女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達和AMD新芯片,突破PCIe限制

智能計算芯世界 ? 來源:半導體行業觀察 ? 2024-03-01 09:16 ? 次閱讀

學過微處理器的同學可能還記得,最初的8086/8088處理器沒有浮點單元。主板通常有一個額外的插槽,用于可選的8087 數學協處理器。數學協處理器進入了 CPU 本身,如今,CPU 沒有可選的數學協處理器。

然而, SIMD 處理器(例如GPU)有多種選擇。眾所周知,GPU 可以比 CPU 主機更快地加速數學處理(例如矩陣運算)。

隨著Nvidia GH-200 處理器 和AMD MI300A APU的推出,市場正在見證“8087 時刻”——即 CPU 吸收外部性能硬件。Nvidia 和 AMD 都已將 GPU 納入處理器中,其結果是 HPC 性能大幅躍升,并預示著未來的發展。

再見 PCI

AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進行通信。CPU 和 GPU 有兩個不同的內存域,數據必須通過 PCI 接口從 CPU 域移動到 GPU 域(并返回)。

使用第 5 代 PCIe 總線中全部 16 個通道的 GPU 的最大帶寬約為 63GB/s。此瓶頸將限制 CPU 和 GPU 之間的內存移動。

Nvidia GH200 通過 900 GB/s 雙向 NVLink-C2C 連接 Grace CPU 和 Hooper GPU。結果大約快了 14 倍。此外,GH200 還帶來了單一共享 CPU-GPU 內存域的優勢。無需通過 PCI 總線在 CPU 和 GPU 之間移動數據。如圖 1 所示,CPU 和 GPU 對所有內存具有一致的視圖。CPU內存高達480GB LPDDR5X(帶ECC),GPU具有96GB HBM3或144GB HBM3e。總的相干(單域)內存在 576GB 到 624GB 之間。

wKgZomXhLMiARMptAADkHTuyYxg500.jpg

當前的 AMD Instinct MI300A APU 中采用單一內存域,具有 128 GB HBM3 內存,使用 Infinity Fabric 在 CPU 和 GPU 之間一致共享,封裝峰值吞吐量為 5.3 TB/s 。 雖然 MI300A 目前不支持像 GH200 那樣額外的 DDR 內存擴展,但 CXL 是一個值得將來記住的詞。

對于 GH200 和 MI300A,關鍵的突出短語是“呈現單個存儲域”。在傳統的CPU-PCIe-GPU組合中,GPU內存量通常小于CPU內存,數據必須通過PCIe接口進行混洗。這兩個新設計消除了這個瓶頸。單個大內存域一直對 HPC 有吸引力,而 GenAI 的增長加速了這種需求(即,能夠在內存中加載大型模型并使用 GPU 運行它們)。對于傳統 GPU,GPU 內存量限制了模型大小,需要采用分布式 GPU 方法。(注:GH200 可以通過外部 NVLink 連接,創建海量統一內存;例如,Nvidia-AWS NLV32可以提供高達 20 TB 的統一內存。)

離你的桌面并不遠

技術領域明顯的趨勢之一是從昂貴的新技術市場轉向低成本的大宗商品市場。高性能計算也不例外。隨著市場需求,從多核到高級內存的一切都已從高端轉移到“手機”。遷移到單個內存域就是這些變化之一。

最近,在 Linux 基準測試網站Phoronix上,杰出的測試員Michael Larabel在 GH200 工作站上運行了 HPC 基準測試。該系統由德國的GPTshop.ai提供。

據了解,系統塔式機箱配備 GH200 Grace Hopper Superchip,配備 576G 內存、雙 2000+ W 電源、QCT 主板以及多種配置選項,包括 SSD 和 NVIDIA Bluefield/Connect-X 適配器。一項有趣且有用的功能是 TDP 可以從 450W 編程到 1000W(CPU + GPU + 內存),這在非數據中心環境中應該很有用。另外,默認風冷噪音據稱為25分貝。液體冷卻也是一種選擇。

然而,桌面超級工作站并不便宜。目前可用的型號 GH200 576GB起價為 47,500 歐元(根據 Phoronix 的說法,由于在歐盟以外地區運輸時無需繳納 19% 的增值稅,因此該價格相當于 41,000 美元)

這個價格可能看起來很高,但考慮到具有 80 GB HBM2e 內存的 Nvidia H100 PCIe GPU 目前的市場價格在 3 萬美元到 3.5 萬美元之間。這不包括為 GPU 供電和運行的主機系統。此外,用戶還受到 80GB GPU 內存的限制,該內存通過 PCIe 總線與主內存域分開。

GPTshop工作站提供576GB的單域內存。HPC 和 GenAI 用戶會發現這半 TB 的 CPU-GPU 內存很有吸引力。

初步基準

借助 GPTshop,Phoronix 能夠遠程運行多個基準測試。基準應被視為初步的,而不是最終的績效衡量標準。特別是,基準測試僅針對 CPU,沒有使用 Hopper A100 GPU。因此,基準圖是不完整的。Phoronix 計劃在未來測試基于 GPU 的應用程序。

據 Phoronix 稱,Ubuntu 23.10 與 Linux 6.5 一起使用 GCC-13 作為標準編譯器。使用類似的環境來測試可比較的處理器,包括 Intel Xeon Scalable、AMD EPYC 和 Ampere Altra Max 處理器。完整的列表可以在Phoronix 網站上找到。

此外,沒有可用于基準測試運行的功耗數據。據 Phoronix 稱,NVIDIA GH200 目前似乎沒有在 Linux 下公開任何 RAPL/PowerCap/HWMON 接口,僅用于讀取 GH200 的功率/能源使用情況。系統上的BMC確實通過Web界面暴露了整個系統的功耗,并且功率數據沒有通過IPMI暴露。

盡管存在這些限制,一些重要的基準測試還是首次在 Nvidia 之外的 GH200 上運行。

好奧萊 HPCG

Phoronix 報告的第一個測試是標準HPCG內存帶寬基準測試,如圖 2 所示。

wKgaomXhLMiAWYYtAAWDqsqK-uw329.jpg

可以看出,GH200 Arm 的性能達到了可觀的 42 GFLOPS,略高于 Xeon Platinum 8380 2P(40 GFLOPS),略低于 EPYC 9654 Genoa 2P(44 GFLOPS)。另外值得注意的是 72 核 Arm Grace CPU,其性能幾乎是 Ampere Altra Max 128 核 Arm 處理器的兩倍。

GH200 在其他基準測試中表現良好。最令人印象深刻的結果如圖 3 所示。使用 72 核 Arm GH200 的NWChem (C240-Bucky Ball) 運行時間為 1404 秒,僅落后于領先者 128 核 Epyc 9554 (2p),成績為 1323 秒。

wKgZomXhLMiAVoZlAATrg6t09VQ779.jpg

即將發生的事情

Nvidia GH200 和 AMD MI300A 引入了新的處理器架構。與吸收 8087 數學協處理器類似,高端 CPU 也開始吸收 GPU(或 SIMD 處理單元)。然而,這個想法并不是全新的。自 2011 年以來,AMD 已將中等 GPU 集成到其臺式機/筆記本電腦APU 處理器中。雖然這些高端處理器可能被認為是“專用”的,因此價格昂貴,但隨著時間的推移,對 GenAI 的巨大興趣可能會將這些設計推向商品價格點。隨著更多基準的出現,這個故事將繼續發展。

此外,引入具有足夠內存的個人高性能工作站,可以在您的辦公桌旁運行一些最大的法學碩士,這是一個重要的里程碑。更不用說運行許多大內存 GPU 優化的 HPC 應用程序的能力了。數據中心和云仍將是當今的主力,但必須要說的是“擁有重置按鈕”。


審核編輯:劉清
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微處理器
    +關注

    關注

    11

    文章

    2370

    瀏覽量

    83821
  • PCIe
    +關注

    關注

    16

    文章

    1322

    瀏覽量

    84641
  • 英偉達
    +關注

    關注

    22

    文章

    3920

    瀏覽量

    93081
  • AMD芯片
    +關注

    關注

    0

    文章

    16

    瀏覽量

    2970

原文標題:英偉達和AMD新芯片,突破PCIe限制

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    據外媒報道,英偉公司發布了一項通知稱,美國政府于9日告知英偉公司;特供版的H20芯片出口到中國需要許可證,緊接著在14日又告知
    的頭像 發表于 04-16 16:59 ?1029次閱讀

    英偉殺瘋了!Blackwell橫掃市場,AMD、英特爾加入降本浪潮

    。與此同時,隨著AI大模型的普及,高計算量需求和成本壓力也成為行業關注的焦點。如何在性能與成本之間找到平衡,成為整個AI芯片行業共同面臨的挑戰。AI大模型的出現對芯片市場產生了哪些影響,DeepSeek帶來的“AI降本浪潮”又會給AMD
    的頭像 發表于 03-02 00:02 ?1795次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>殺瘋了!Blackwell橫掃市場,<b class='flag-5'>AMD</b>、英特爾加入降本浪潮

    荷蘭與英偉AMD商討共建人工智能設施

    荷蘭政府正在積極尋求與全球領先的科技公司英偉AMD的合作,共同推動荷蘭人工智能設施的建設與發展。 據荷蘭政府官方網站的消息,荷蘭經濟事務大臣迪爾克·貝爾亞爾茨于近日對美國硅谷進行了訪問,期間
    的頭像 發表于 01-10 13:36 ?644次閱讀

    英偉被立案調查 英偉回應反壟斷調查

    英偉被立案調查!?國家市場監督管理總局在12 月 9 日晚宣布,英偉公司涉嫌違反《中華人民共和國反壟斷法》及《市場監管總局關于附加限制
    的頭像 發表于 12-10 15:03 ?454次閱讀

    英偉市值飆升,逼近蘋果

    近日,隨著人工智能技術的持續繁榮,英偉公司作為AI芯片生產的領軍者,其市值實現了驚人的飛躍。截至美國當地時間21日,英偉的市值再創歷史新
    的頭像 發表于 10-23 09:31 ?559次閱讀

    AMD發布英偉競品AI芯片,預期市場規模將大幅增長

    10月11日,AMD英偉主導的AI算力市場中舉辦了一場人工智能主題發布會,推出了包括MI325X算力芯片在內的一系列新品。然而,市場對此反應平平,
    的頭像 發表于 10-11 16:25 ?942次閱讀

    成都匯陽投資關于華為新版芯片或挑戰英偉,國產算力值得關注?

    、稀缺性和確定性特征,成為了當前中美科技競爭的焦點。為了限制中國的AI產業,自 2022 年底開始,美國持續升級半導體出口管制,英偉的主力芯片很難出口到中國,導致國內AI算力環節受到
    的頭像 發表于 08-19 11:44 ?1362次閱讀

    AI芯片巨頭英偉漲超4% 英偉市值暴增7500億

    誰是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉肯定有一席之地,特別是現在全球資本市場動蕩之際,業界分析師多認為英偉是最佳“反彈股”
    的頭像 發表于 08-13 15:33 ?1361次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    英偉帶領芯片股飆升 英偉大漲4.76%

    英偉不愧是總龍頭,大漲4.76%。英偉帶領芯片股飆升;甚至可以說是帶動了美國股市上漲,在當地時間22日,科技股反彈,帶動整體行情走高。美
    的頭像 發表于 07-23 16:26 ?523次閱讀

    英偉在AI芯片市場還能領先多久?

    7月22日,國際媒體傳來消息,英偉在近年來興起的生成式人工智能浪潮中脫穎而出,其高性能計算芯片如H100等廣受業界青睞,推動了公司營收與利潤的大幅增長。這一強勁表現不僅助力英偉
    的頭像 發表于 07-22 16:18 ?872次閱讀

    打破英偉CUDA壁壘?AMD顯卡現在也能無縫適配CUDA了

    電子發燒友網報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態,是英偉在GPU領域最大的護城河,尤其是隨著目前AI領域的發展加速,市場火爆,英偉GPU+CUDA的開發生態則更加
    的頭像 發表于 07-19 00:16 ?5693次閱讀

    英偉Blackwell芯片已投產,預告未來AI芯片發展

    英偉創始人兼CEO黃仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產。這款芯片英偉
    的頭像 發表于 06-04 09:23 ?2200次閱讀

    美國限制英偉AMD向中東銷售AI芯片

    據知情人士透露,美國官方已經收緊了對向英偉(NVIDIA)和AMD芯片制造商發放向中東地區出口AI加速器的許可證,同時正在進行一項關于該地區人工智能開發的國家安全評估。
    的頭像 發表于 05-31 14:25 ?2676次閱讀