女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

采用NVIDIA GPU加速HPC應用性能提升

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-06-08 10:57 ? 次閱讀

本文作者:

Ashraf EassaNVIDIA 加速計算部門高級產品營銷經理

Chris PorterNVIDIA HPC & AI 高級技術營銷經理

高性能計算(HPC)已經成為必不可少的科學研究工具。

無論是研發出拯救生命的新藥,還是抵御氣候變化,或是精確模擬我們的世界,這些解決方案都需要強大的處理能力,而且這一需求正在快速增長,日益超出傳統計算方法能夠應對的范疇。

因此,業界紛紛采用 NVIDIA 的 GPU 進行加速計算。結合 AI,它能帶來數百萬倍的性能加速,推動科學的進步。如今,已有 2700 個應用受益于 NVIDIA GPU 加速,而在日益增長的 300 萬開發者共同組成的社區支持下,這一數字仍在不斷攀升。

HPC 應用性能提升

為將所有 HPC 應用的速度提升數倍,我們需要在堆棧的每個層面進行不斷的創新,包括芯片、系統以及應用框架本身。

隨著架構和 NVIDIA 軟件棧整體上的不斷進步, NVIDIA 平臺的性能每年都會顯著提高。與六年前發布的 P100 相比, H100 Tensor Core GPU 的性能提高 26 倍,比摩爾定律快 3 倍以上。

NVIDIA 平臺的核心是一個功能豐富的高性能軟件堆棧。為了方便各種 HPC 應用實現 GPU 加速,該平臺加入了 NVIDIA HPC SDK。SDK 使開發者能夠使用標準語言、導語指令以及 CUDA 來編寫和移植 GPU 加速應用,為開發者帶來了無與倫比的靈活性。

NVIDIA HPC SDK 的強大之處在于其龐大且高度優化的 GPU 加速數學庫,使用戶能夠充分發揮 NVIDIA GPU 的性能潛力。為了實現最佳的多 GPU 和多節點擴展性能, NVIDIA HPC SDK 還提供強大的通信庫:

NVSHMEM 為跨多個 GPU 內存的數據創建了一個全局地址空間。

NVIDIA 集合通信庫(NCCL)優化了 GPU 之間的通信。

總之,該平臺提供最高的性能和靈活性,為龐大的、不斷增長的 GPU 加速 HPC 應用提供支持。

HPC 的性能和能效

為了展示 NVIDIA 全棧創新如何助力加速 HPC 實現最高性能, 我們將一臺配備 4 顆 NVIDIA GPU 的慧與(HPE)服務器與一臺配備另一家廠商同等數量加速器模塊且配置相似的服務器進行了性能比較。

我們使用多種算例測試了廣泛使用的五個 HPC 應用。盡管在各個行業中有約 2700 個應用基于 NVIDIA 平臺實現了加速,但由于另一家廠商的加速器只支持部分軟件和應用版本,我們在此次比較中所能使用的應用有限。

對于除 NAMD (用于分子動力學模擬的軟件)以外的所有應用,我們首先獲得多個算例的結果,然后使用它們的幾何平均值作為計算結果,這樣可以將異常值的影響最小化并反映客戶的體驗。

我們還在多 GPU 和單 GPU 場景下測試了這些應用。

在多 GPU 場景中,測試系統中的所有加速器都被用來運行一個模擬,基于 A100 Tensor Core GPU 的服務器所提供的性能比起另一臺服務器高出 2.1 倍。

得益于計算性能的持續進步,分子動力學領域正朝著模擬更大的原子體系和更長的時間的方向發展。這使研究者能夠模擬越來越多的生物化學機制,例如光合電子傳遞和視覺信號轉導。對于此類過程,由于模擬這一主要驗證方式耗時過長,之前無法通過模擬來對其進行驗證,導致這類過程也一直引發科學界的爭論。

但我們認識到,并非所有用戶都會在每次模擬時使用多個 GPU 運行。為了獲得最佳吞吐量,最好的方法往往是為每次模擬分配一個 GPU。

當在單一加速器模塊( NVIDIA A100 上一個的完整 GPU 和另一款產品上的兩個計算芯片)上運行這些應用時,基于 NVIDIA A100 的系統提供了高達 1.9 倍的性能。

電力成本占據了數據中心和超級計算中心總擁有成本(TCO)中的很大一部分,這突出了高能效計算平臺的重要性。根據我們的測試, NVIDIA 平臺的每瓦吞吐量比其他產品高 2.8 倍。

多年來, 我們為了最大限度地提高應用性能和效率而堅持不懈地進行軟硬件協同優化,最終打造出具有卓越性能和能效的 NVIDIA A100 GPU。欲進一步了解 NVIDIA Ampere 架構,請參見 NVIDIA A100 Tensor Core GPU 白皮書。

A100 在操作系統中也表現為一個單一的處理器,只需要啟動一個 MPI 線程就可以充分發揮它的性能。而且由于一個節點中所有 GPU 之間都采用 600-GB/s NVLink 互聯,因此 A100 可以提供出色的擴展性能。

AI 與 HPC 的融合

正如加速計算將模擬和仿真應用的速度提高了數倍, AI 和 HPC 的結合也將進一步提升性能,推動下一波科學研究的發展。

從我們首次提交 MLPerf 訓練結果到最近一次提交,已有三年的時間。在這三年里, NVIDIA 平臺在這套由同行評審的行業標準基準測試中將深度學習性能提高了 20 倍。這些成果來自于芯片、軟件和規模上的全面提高。

科學家和研究者已在使用 AI 大幅提升性能,加快科學研究的速度。

使識別引力波所需的時間減少為原來 10 萬分之一。

對呼吸道飛沫中的 Delta SARS-CoV-2 病毒(原子數超過 10 億)進行模擬的速度提高 1000 倍。

加速清潔聚變能源的發展。

為余熱鍋爐(HRSG)工廠創建預測性數字孿生。

世界各地的超級計算中心都在持續使用加速 AI 超級計算機。

阿貢領導力計算設施(ALCF)的 Polaris 超級計算機、美國國家能源研究科學計算中心(NERSC)的 Perlmutter、意大利多所大學組建的 CINECA 聯盟建設的 Leonardo,均采用 A100 Tensor Core GPU 加速。

即將在 2023 年上線的 Alps 超級計算機基于 NVIDIA 的 Grace Hopper 超級芯片打造而成。

計劃于 2023 年交付的洛斯阿拉莫斯國家實驗室的 Venado 系統,將包含 Grace Hopper 超級芯片以及 Grace CPU 超級芯片節點。

原文標題:NVIDIA 通過全棧創新推動高性能計算的發展

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5258

    瀏覽量

    105864
  • HPC
    HPC
    +關注

    關注

    0

    文章

    333

    瀏覽量

    24221
  • 高性能計算
    +關注

    關注

    0

    文章

    87

    瀏覽量

    13619

原文標題:NVIDIA 通過全棧創新推動高性能計算的發展

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環境中的 AI 驅動工作負載提供動力,提高了
    的頭像 發表于 04-07 11:28 ?541次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發表于 03-28 09:59 ?531次閱讀

    使用NVIDIA CUDA-X庫加速科學和工程發展

    NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPU 和 GPU 資源間深度自動化整合與調度,相較于傳統加速計算架構,該技術可使計算工程工具運行速度
    的頭像 發表于 03-25 15:11 ?589次閱讀

    英偉達GTC2025亮點:NVIDIA Blackwell加速計算機輔助工程軟件,實現實時數字孿生性能數量級提升

    、Altair、Cadence、Siemens 和 Synopsys 等在內的領先計算機輔助工程(CAE)軟件供應商正在使用 NVIDIA Blackwell 平臺加速其仿真工具,速度提升高達 50 倍
    的頭像 發表于 03-21 15:12 ?565次閱讀

    超級計算與 HPC 之間的界限日趨模糊

    難以區分,這推動了商業和科學應用性能的巨大提升,也給兩者帶來了類似的挑戰。雖然超級計算和高性能計算(HPC)的目標一直很相似(超快處理速度),但它們所服務的市場卻截
    的頭像 發表于 03-17 10:33 ?482次閱讀
    超級計算與 <b class='flag-5'>HPC</b> 之間的界限日趨模糊

    GPU加速計算平臺的優勢

    傳統的CPU雖然在日常計算任務中表現出色,但在面對大規模并行計算需求時,其性能往往捉襟見肘。而GPU加速計算平臺憑借其獨特的優勢,吸引了行業內人士的廣泛關注和應用。下面,AI部落小編為大家分享
    的頭像 發表于 02-23 16:16 ?354次閱讀

    利用NVIDIA DPF引領DPU加速云計算的未來

    越來越多的企業開始采用加速計算,從而滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 推出了 DOCA 平臺框架(DPF),該框架提供了基礎構建模塊來釋放 NVIDIA Blu
    的頭像 發表于 01-24 09:29 ?617次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領DPU<b class='flag-5'>加速</b>云計算的未來

    借助NVIDIA GPU提升魯班系統CAE軟件計算效率

    本案例中魯班系統高性能 CAE 軟件利用 NVIDIA性能 GPU,實現復雜產品的快速仿真,加速產品開發和設計迭代,縮短開發周期,
    的頭像 發表于 12-27 16:24 ?588次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    問題,但會降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    發表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優化的思考。 GPU的存儲體系采用了獨特的倒金字塔結構,在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統馮諾依曼架構的內存瓶頸,合并訪存機制巧妙解決了內存帶寬限制。NVIDIA
    發表于 11-24 17:12

    使用Arthas火焰圖工具的Java應用性能分析和優化經驗

    分享作者在使用Arthas火焰圖工具進行Java應用性能分析和優化的經驗。
    的頭像 發表于 10-28 09:27 ?1087次閱讀
    使用Arthas火焰圖工具的Java<b class='flag-5'>應用性能</b>分析和優化經驗

    AMD與NVIDIA GPU優缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產品在性能、功耗、價格等方面都有著不同的特點和優勢。 一、性能
    的頭像 發表于 10-27 11:15 ?2175次閱讀

    NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

    NVIDIA GPU 上運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現新的用途并提升能效。
    的頭像 發表于 09-13 17:13 ?1171次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是一家高性能數據庫研發企業,也是 NVIDIA 初創加速計劃成員,其開發的產品基于高性能分布式時序數據庫,是支持復雜計算和流數據分析的實時計算平臺,適用于金融、電力
    的頭像 發表于 09-09 09:57 ?786次閱讀
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺<b class='flag-5'>提升</b>計算<b class='flag-5'>性能</b>

    NVIDIA突破美國禁令,將在中東部署其高性能AI/HPC GPU加速

    Ooredoo達成合作協議,將在中東地區部署其高性能AI/HPC GPU加速卡。這一舉動不僅標志著NVIDIA在中東市場的戰略布局取得了重大
    的頭像 發表于 06-24 14:47 ?1181次閱讀