女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

分析 丨 AI數據中心堪比超算,NVIDIA與AMD同場競技

芯查查 ? 來源:芯查查 ? 作者:芯查查 ? 2023-07-17 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超級計算機對于科學研究、能源、工程設計領域具有重要意義,在商業用途中也發揮重要作用。2022年高性能計算專業大會發布的全球超級計算機Top500排行榜顯示,美國橡樹嶺國家實驗室(ORNL)的Frontier系統位列榜首,自2022年6月以來,Frontier一直是全球超級計算機Top500名單上的強大設備。

wKgaomS0o3WAHNjJAACA-ItwBNA72.webp

圖注:全球超級計算機Top10,發布時間為2022年11月(來源:中科院網信工作網)

進入2023年,超級計算機的排行將發生改變。

芯查查APP顯示,在美國勞倫斯利弗莫爾國家實驗室(LLNL)安裝的“El Capitan”超級計算機最快于2023年底啟動,從而可能刷新全球超級計算機榜單。El Capitan估計FP64峰值性能約為2.3 exaflops,比Frontier超級計算機的1.68 exaflops性能高出約37%。

同時,人工智能AI)應用掀起,超大規模云服務企和AI初創企業都開始構建大型數據中心,比如,NVIDIA和CoreWeave正在為Inflection AI開發數據中心;Microsoft Azure正在為OpenAI構建的數據中心。從下圖可以看出,目前在建的這兩個AI數據中心在TFLOPS算力性能上雖然不如現有的超級計算機,但是在成本上已經超出很多。

wKgZomS0o3WAcF1_AAqzKgfquTo13.webp

圖注:超級計算機與AI數據中心對比(來源:nextplatform網站)

AI數據中心面向AI訓練和推理進行配置,在建的AI數據中心進程如何?使用了哪些處理器

Inflection AI使用處理器:NVIDIA H100Inflection AI是一家由Deep Mind前負責人創建,并由Microsoft和Nvidia支持的新創業公司。目前估值約為40億美元,產品為AI聊天機器人,支持計劃、調度和信息收集。

在籌集了13億美元的資金之后,Inflection AI將建立一個由多達22000個NVIDIA H100 GPU驅動的超級計算機集群,其峰值理論計算能力將與Frontier相當。理論上能夠提供1.474 exaflops的FP64性能。在CUDA內核上運行通用FP64代碼時,峰值吞吐量僅為其一半:0.737 FP64 exaflops(與前文圖表數值略有出入,但相差不大)。雖然FP64性能對于許多科學工作負載很重要,但對于面向AI的任務,該系統可能會更快。FP16/BF16的峰值吞吐量為43.5 exaflops,FP8吞吐量的峰值吞吐量是87.1 exaflops。

圖片來源:NVIDIA

Inflection AI的服務器集群成本尚不清楚,但NVIDIA H100 GPU零售價超過30000美元,預計該集群的GPU成本將達到數億美元。加上所有機架服務器和其他硬件,將占13億美元資金的大部分。

在市場需求遠遠超過供應的情況下,NVIDIA或AMD不會為其GPU計算引擎給予大幅折扣就,其服務器OEM和ODM合作伙伴同樣如此。因此,與美國的百億億次高性能計算系統相比,這些設備非常昂貴。Inflection AI的FP16半精度性能為21.8 exaflops,足以驅動一些非常大的LLM和DLRM(大型語言模型和深度學習推薦模型)。

El Capitan使用處理器:AMD Instinct MI300A為超級計算機“El Capitan”提供算力的處理器是“Antares”AMD Instinct MI300A CPU-GPU混合體,其FP16矩陣數學性能仍然未知。

wKgZomS0o3aAJ_eFAAgqMM3KNEw45.webp

圖注:基于AMD MI300的刀片設施(來源:http://tomshardware.com

Instinct MI300是一款數據中心APU,它混合了總共13個chiplet,其中許多是3D堆疊的,形成一個單芯片封裝,其中包含24個Zen 4 CPU內核,融合CDNA 3圖形引擎和八個總容量為128GB的HBM3內存堆棧。這個芯片擁有1460億個晶體管,使其成為AMD投入生產的最大芯片。其中,由9個計算die構成的5nm CPU和GPU混合體,在4個6nm die上進行3D堆疊,這4個die主要處理內存和I/O流量。

預計每個MI300A在2.32 GHz時鐘頻率下可提供784 teraflops性能,常規MI300的時鐘頻率約為1.7GHz。惠普公司(HPE)或許在El Capitan系統中為每個滑軌配置8個MI300A,El Capitan的計算部分應該有大約2931個節點、46個機柜和8行設備。基于上述猜測,El Capitan應該有大約23500個MI300 GPU,具備大約18.4 exaflops的FP16矩陣數學峰值性能。相比Inflection AI,用更少的錢,發揮出更大性能。

Microsoft/OpenAI使用處理器:NVIDIA H100傳聞Microsoft正在為OpenAI構建25000 GPU集群,用于訓練GPT-5。

從歷史上看,Microsoft Azure使用PCI-Express版本的NVIDIA加速器構建其HPC和AI集群,并使用InfiniBand網絡將它們連接在一起。

為OpenAI構建的集群使用NVIDIA H100 PCI-Express板卡,假設為每個20000美元,即5億美元。另外,使用英特爾“Sapphire Rapids”至強SP主機處理器、2TB的主內存和合理數量的本地存儲,每個節點再增加150000美元,這將為容納這25000個GPU的3125個節點再增加4.69億美元。InfiniBand網絡將增加2.42億美元。合計12.1億美元,這些費用要比國家實驗室的超級計算機貴很多。

全球超級計算機追求新穎的架構,為最終商業化而進行研發。超大規模云服務商可以做同樣的數學運算,構建自己的計算引擎,包括亞馬遜網絡服務、谷歌、百度和Facebook都是如此。即使有50%的折扣,諸如Inflection AI和OpenAI的設備單位價格仍然比國家實驗室為超級計算機昂貴。

“神威·太湖之光”使用處理器:申威26010以2022年的全球超級計算機榜單來看,進入Top10的我國超級計算機是“神威·太湖之光”。資料顯示,該計算機安裝了40960個中國自主研發的申威26010眾核處理器,采用64位自主神威指令系統,峰值性能為12.5億億次每秒,持續性能為9.3億億次每秒,核心工作頻率1.5GHz。

申威和龍芯目前是我國自研處理器的代表,兩者均采用自研處理器的指令集架構。CPU國產化目前有3種方式,一個是獲得x86內核授權,一個是獲得Arm指令集架構授權,另一種是自研指令集架構,這種方式的安全可控程度較高,也是自主化較為徹底的一種方式。

wKgaomS0o3aAKjaPAAC8Au-mzr868.webp

圖注:國內服務器處理器廠商

小 結隨著人工智能應用發酵,超級計算機與AI數據中心的界限可能變得模糊,兩者的硬件和架構已經發展到可以更快地處理更多數據,因此其配置將會逐步超越,芯查查認為,整體呈現為幾點趨勢:面向AI應用,高性能處理器采用更多核心、異質架構將更加普遍,以支持更多的并行計算和更快的數據處理速度,處理器的內存管理和緩存設計也得到了優化,以減少對主存儲器的訪問延遲。專門的加速器,比如圖形處理單元(GPU)和神經網絡處理單元(NPU),將被引入處理器,高效地執行矩陣計算和神經網絡。能效是AI數據中心和超級計算機共同難點,處理器能效成為要點,設計趨向于降低功耗和散熱需求,采用更先進的制程技術、優化的電源管理以及動態頻率調節等方法。AI數據中心和超級計算機建設的需求推動了處理器的發展,也推動了存儲、結構和GPU的進步,這些組件都將服務于系統的數據吞吐量和效率。


審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據中心
    +關注

    關注

    16

    文章

    5226

    瀏覽量

    73506
  • AI
    AI
    +關注

    關注

    88

    文章

    35109

    瀏覽量

    279598
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國民技術發布面向AI數據中心的3 kW數字電源參考設計方案

    2024報告記錄,電力消耗已占AI數據中心運營成本的60%以上,AI電源是驅動瓦特向比特轉化的智能神經中樞,通過極致能效與動態調度實現“每度電產出最大有效
    的頭像 發表于 07-16 17:13 ?240次閱讀
    國民技術發布面向<b class='flag-5'>AI</b><b class='flag-5'>數據中心</b>的3 kW數字電源參考設計方案

    簡單認識安森美AI數據中心電源解決方案

    面對AI力需求爆發式增長,數據中心電力系統正面臨前所未有的挑戰。安森美(onsemi)推出的AI數據中心電源解決方案,直擊能效、尺寸等痛點
    的頭像 發表于 07-05 13:03 ?1804次閱讀
    簡單認識安森美<b class='flag-5'>AI</b><b class='flag-5'>數據中心</b>電源解決方案

    晶科能源N型TOPCon組件滿足AI數據中心的能源剛需

    人工智能的爆發式發展正將數據中心推向能源消耗的“臨界點”——一座大型數據中心年用電量一座小型城市的居民用電總和,而國際能源署預測,到2030年全球
    的頭像 發表于 04-23 09:33 ?372次閱讀

    適用于數據中心AI時代的800G網絡

    隨著人工智能(AI)技術的迅猛發展,數據中心面臨著前所未有的計算和網絡壓力。從大語言模型(LLM)訓練到生成式AI應用,海量數據處理需求推動了網絡帶寬的快速增長。在此背景下,800G網
    發表于 03-25 17:35

    DeepSeek推動AI力需求:800G光模塊的關鍵作用

    隨著人工智能技術的飛速發展,AI力需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務對力的需求持續攀升,直接推動了服務器、光通信設備以及數據中心基礎設施的升級。特
    發表于 03-25 12:00

    施耐德電氣如何助力數據中心行業平衡能耗與

    隨著AI大模型井噴式快速發展,數據中心行業正處于通用力向智能力的革新期。高功率密度需求、高散熱需求下,傳統數據中心基礎設施也繼續一次“新
    的頭像 發表于 03-24 11:29 ?452次閱讀

    Cadence顛覆AI數據中心設計

    日前舉辦的英偉達 GTC 2025 開發者大會匯聚了眾多行業精英,共同探討人工智能的未來。而人工智能正在重塑全球數據中心的格局。據預測,未來將有 1 萬億美元用于 AI 驅動的數據中心升級。然而
    的頭像 發表于 03-21 15:43 ?451次閱讀

    數據中心發展與改造

    存在的問題 1.?電費成本高企,占40% 數據中心電力成本占運營總成本的40%-60%,部分AI力密集型場景甚至高達70%。以年耗電2
    的頭像 發表于 02-28 16:50 ?386次閱讀
    <b class='flag-5'>數據中心</b>發展與改造

    AI力需求激增,數據中心如何應對能源挑戰

    ? “AI的爆發帶來了巨大的力需求,為了滿足AI大模型的訓練和應用推理,智中心的建設將加速。根據工信部的規劃,中國智能
    的頭像 發表于 02-22 09:49 ?582次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b>力需求激增,<b class='flag-5'>數據中心</b>如何應對能源挑戰

    中心會取代通用中心嗎?

    隨著人工智能(AI)技術的飛速發展,計算需求不斷攀升,數據中心行業正經歷著前所未有的變革。傳統的通用中心與新興的智
    的頭像 發表于 01-06 14:45 ?552次閱讀
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>會取代通用<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>嗎?

    AMD數據中心業務收入超越Intel

    領導者Intel。 相比之下,Intel的數據中心AI業務收入為33.49億美元,雖然同比增長了9%,但在與AMD的競爭中略顯遜色。這一數據對比凸顯了
    的頭像 發表于 11-07 11:10 ?815次閱讀

    AMD數據中心業務首英特爾,Nvidia異軍突起

    長期以來,英特爾在數據中心CPU市場占據主導地位,其Xeon處理器為絕大多數服務器提供動力。大約七、八年前,AMD的處理器在市場份額中還只是個位數。然而,這一局面已經發生了翻天覆地的變化。盡管英特爾
    的頭像 發表于 11-06 15:49 ?1015次閱讀

    AI數據中心的能源危機,需要更高效的PSU

    電子發燒友網報道(文/梁浩斌)數據中心在近年AI的浪潮中得到極大的發展,力需求的膨脹帶動全球數據中心建設規模呈現爆發式增長。而在數據中心
    的頭像 發表于 11-04 02:21 ?6858次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>數據中心</b>的能源危機,需要更高效的PSU

    AMD全新處理器擴大數據中心CPU的領先地位

    在Computex 2024 開幕主題演講上,AMD 詳細介紹了全新的 CPU、NPU 和 GPU 領先架構,為從數據中心到個人電腦的端到端 AI 基礎架構帶來強大力。
    的頭像 發表于 09-19 11:01 ?916次閱讀

    NVIDIA 在 Hot Chips 大會展示提升數據中心性能和能效的創新技術

    NVIDIA Blackwell 平臺提供動力的最新技術進展,以及新的數據中心液冷研究成果和用于芯片設計的 AI 代理。 他們
    的頭像 發表于 08-28 16:38 ?647次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大會展示提升<b class='flag-5'>數據中心</b>性能和能效的創新技術