女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大家都在爭相超過A100,無人對標的Grace Hopper性能幾何?

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-09-06 01:10 ? 次閱讀

電子發燒友網報道(文/周凱揚)作為英偉達CPUGPU技術開發上的集大成之作,Grace Hopper很大程度上象征著復雜計算領軍產品。盡管英偉達竭盡所能地去堆這一“超級芯片”的性能,但英偉達還是選擇將Grace Hopper(GH200)描述成了世界上最萬能的計算平臺,這也得益于它同時在AI計算和HPC計算領域展現的可怕性能。

AI計算性能

相信絕大多數人已經從市場瘋搶A100、H100的現狀,對Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作為一個異構計算平臺,在與傳統的x86 CPU與H100對比上,也有著不小的性能差距。

首要區別自然就是連接Grace CPU和Hopper GPU的NVLink-C2C,這一高帶寬低延遲的互聯技術可謂是目前唯一能發揮H100近乎全部實力的方案。支持最高144TB內存的同時,提供900GB/s的帶寬。

英偉達官方也對部分AI計算負載進行了測試,在終端應用上對比x86+Hopper與Grace Hopper的一體化方案有何異同。其性能差距可以說是巨大的,就拿最常見的大語言模型推理來說,GH200可以做到x86平臺的4.5倍性能表現,而DLRM(深度學習推薦模型)訓練與圖神經網絡(GNN)訓練的性能也可以分別達到3.5倍和1.9倍。

其實這里的差異還是體現在互聯方案的帶寬上,例如x86+Hopper的方案還是在使用PCIe方案,該方案在batch size較小時性能落后還不算明顯,一旦到了更大的batch size,PCIe的帶寬就成了瓶頸,而不斷以高帶寬輸送數據給H100的NVLink-C2C則可以實現比PCIe高出數倍的性能。

HPC計算性能

Grace Hopper的另一大應用領域自然就是HPC了。HPC主要集中在一些科學、工程的復雜計算上,比如天氣預測、生命科學、流體力學等。然而與此同時,不少商業相關的HPC計算也在進一步推動HPC的發展,甚至更早用上最新的芯片技術,比如油藏模擬等。

著名油藏模擬軟件ECHELON的開發商Stone Ridge,在最近獲得了早期訪問權,對英偉達的H100-PCIe、H100-NVL和Grace-Hopper來了場性能測試。早在Volta和Ampere架構時,Stone Ridge就對不同架構的GPU進行了測試,而如今的H100相較這些舊GPU已經在CUDA核心、內存容量和內存帶寬上有了數倍的提升。

這些還只是表面上的變化,英偉達還引入了諸多架構改進,提高了ML和HPC應用程序的性能。而Grace Hopper相較傳統的x86+GPU方案就更具優勢了,首先Grace本身就是一個強大的CPU,每個內核都有四個128位適量單元,超高的內存帶寬以及超大的L2+L3緩存。其次,NVLink的存在大大減少了CPU和GPU之間的通信時間。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架構不同版本的英偉達GPU在ECHELON模型上的性能對比 / Stone Ridge


Stone Ridge選擇了不同細胞規模的模型,從83000個細胞到670萬個細胞,其中Grace Hopper都展現出了不俗的性能,最高可達Volta架構的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架構,所以ECHELON必須重新編譯才能在系統上運行,不過對于ECHELON來說,重新編譯并不要花太多力氣,他們在不修改代碼的情況就成功重編譯在GH200上正常運行。如果對代碼進行進一步優化的話,還有機會獲得更高的性能表現。如此高的性能提升,意味著油藏勘探模擬的時間可以被大幅縮短,從而加快油藏評估的速度。

結語

可以說無論是A100還是H100,都只是英偉達在AI與HPC戰線擴大戰果的第一步棋,明年Q2交付到各大系統中的GH200才是最大的殺手锏,也很可能會成為更搶手的數據中心與超算中心硬件產品。這也恰好證明了英偉達給它的定位,世界上最萬能的計算平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點展示了其全新的 Grace CPU C1,并獲得多家主要原始設計制造商合作伙伴的大力支持。
    的頭像 發表于 05-22 10:01 ?142次閱讀

    SL9486A DCDC100V降壓恒壓芯片 優勢替代兼容MP9486A 國產替代

    SL9486A100V耐壓降壓恒壓電源芯片,全面升級替代MP9486A的最佳方案 在高壓電源管理領域,SL9486A憑借其卓越的性能與兼容
    發表于 04-12 10:59

    精密幾何測量技術在電子芯片制造中的重要性

    精密幾何測量技術在電子芯片制造中具有極其重要的地位,主要體現在以下幾個方面:1、確保芯片性能-晶體管性能優化:在芯片中,晶體管的尺寸和結構對其性能至關重要。通過精密
    的頭像 發表于 02-28 14:23 ?362次閱讀
    精密<b class='flag-5'>幾何</b>測量技術在電子芯片制造中的重要性

    英偉達A100和H100比較

    英偉達A100和H100都是針對高性能計算和人工智能任務設計的GPU,但在性能和特性上存在顯著差異。以下是對這兩款GPU的比較: 1. 架構與核心規格:
    的頭像 發表于 02-10 17:05 ?3414次閱讀
    英偉達<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比較

    植保無人機電池性能測試方法

    隨著農業現代化的不斷推進,植保無人機作為一種高效、精準的農業植保工具,正逐漸受到廣大農戶和農業企業的青睞。植保無人機的性能在很大程度上取決于其搭載的電池系統,因此,對植保無人機電池進行
    的頭像 發表于 01-08 09:26 ?848次閱讀
    植保<b class='flag-5'>無人</b>機電池<b class='flag-5'>性能</b>測試方法

    小軸距高性能!時代星光發布蜂鷹F1超高性價比單兵無人

    隨著無人機產業的發展,無人機在各個行業、各個領域的應用都在不斷深化。近日,時代星光科技發布了全新自研的高性能單兵無人機蜂鷹F1,以輕巧便攜、
    的頭像 發表于 12-24 15:01 ?513次閱讀
    小軸距高<b class='flag-5'>性能</b>!時代星光發布蜂鷹F1超高性價比單兵<b class='flag-5'>無人</b>機

    商超便利店配送“新寵”,九識無人車為100余家門店降本!

    被九識無人車而改變,負責人楊經理的話語中透露出的對九識無人車的由衷認可。目前,九識無人車的運營服務已經覆蓋了近十個省份,超過100家商超便利
    的頭像 發表于 12-17 14:21 ?765次閱讀
    商超便利店配送“新寵”,九識<b class='flag-5'>無人</b>車為<b class='flag-5'>100</b>余家門店降本!

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    GPGPU的靈活計算能力,經歷了翻天覆地的變化。以三角形圖元為基礎的幾何處理階段,通過T&L(Transform and Lighting)單元完成頂點變換與光照計算;光柵化階段將3D
    發表于 11-24 17:12

    英偉達CEO確認:液冷Grace Blackwell服務器無過熱問題

    問題”。 這一表態無疑為市場注入了一劑強心針。隨著數據中心運算需求的不斷增長,服務器的散熱問題日益凸顯,成為制約其性能發揮的關鍵因素之一。而英偉達作為全球領先的圖形處理器(GPU)制造商,其服務器產品的散熱性能自然備受矚目。 據悉,Gr
    的頭像 發表于 11-21 11:45 ?535次閱讀

    本期為大家帶來的是100W氮化鎵充電器詳細介紹拆解。

    本期為大家帶來的是100W氮化鎵充電器詳細介紹拆解。 這款充電器配備折疊插腳以及2C1A接口,兩個USB-C口均支持100W PD快充和PPS快充,USB-
    的頭像 發表于 11-11 14:59 ?2006次閱讀
    本期為<b class='flag-5'>大家</b>帶來的是<b class='flag-5'>100</b>W氮化鎵充電器詳細介紹拆解。

    軟銀升級人工智能計算平臺,安裝4000顆英偉達Hopper GPU

    達Ampere GPU。通過新增的4000顆Hopper GPU,該平臺的總計算性能已躍升至每秒約4.7百億億次。
    的頭像 發表于 11-04 16:18 ?738次閱讀

    寶礫微DC-DC升級壓電動代步工具、無人機電源方案

    | |PL89021|5.0-100|1|降壓轉換器|ESOP8| 電動車、無人機、電信系統 | Pin兼容:LM5164/SQ27001FCC功能兼容:SY8501 | |PL89032|12-100
    發表于 09-11 10:25

    英偉達或取消B100轉用B200A代替

    今年3月份,英偉達在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現行H100/H200,并有與Grace CPU協作的GB2
    的頭像 發表于 08-08 17:19 ?841次閱讀

    干貨 購買無人叉車你必須知道的4條建議 都在這兒了

    在現代化物流領域,無人叉車憑借其高效、智能和自動化的特點,已成為企業提升運營效率、降低成本的重要工具。然而,在購買無人叉車之前,企業需要對叉車的各項性能和配置進行全面了解,以確保其能夠滿足實際作業
    的頭像 發表于 06-19 10:40 ?459次閱讀

    機床的幾何精度什么和什么時是有區別的

    機床的幾何精度是指機床在加工過程中,其各部件的幾何形狀和相互位置精度。它直接關系到機床的加工精度和加工質量。機床的幾何精度主要包括機床的直線度、平面度、圓度、同軸度、垂直度等。下面將詳細介紹機床
    的頭像 發表于 06-07 10:31 ?2030次閱讀