女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Magnum IO用于云本機超級計算架構

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-15 14:54 ? 次閱讀

超級計算機是一項重要的投資,但對于研究人員和科學家來說,它們是極其寶貴的工具。為了有效和安全地共享這些數據中心的計算能力, NVIDIA 引入了云本地超級計算架構。它結合了裸機性能、多租戶和超級計算的性能隔離。

Magnum IO是數據中心的 I / O 子系統,它引入了新的增強功能,以加速支持多租戶數據中心的 I / O 和通信。我們將這些增強功能稱為 Magnum IO ,用于云本機超級計算架構。

它們由 NVIDIA Quantum-2 InfiniBand 平臺提供,該平臺包括 NVIDIA Quantum-2 交換機系列、BlueField-3 DPU 和 ConnectX-7 網絡適配器。

這種進化環境的挑戰是什么?

基于 GPU 的高性能計算已經通過機器學習模擬改變了科學并增強了實驗。運行這些深度學習框架和模擬工具的 GPU 會消耗數 PB 的數據,并在整個數據中心造成擁塞和瓶頸。使事情進一步復雜化的是,這些應用程序的多個實例在共享超級計算基礎設施中同時運行會對每個應用程序的性能產生不利影響,從而導致無法預測的運行時間。

Magnum IO for Cloud 本機超級計算體系結構具有新的和改進的功能,以減輕在多租戶環境中運行對最終用戶性能的負面影響。它提供確定性的性能級別,就好像它們的應用程序是網絡上唯一運行的應用程序一樣。

第三代 NVIDIA SHARP (可擴展分層聚合和縮減協議)

夏普技術通過消除端點之間多次發送數據的需要,將集合操作從主機 CPU 卸載到交換機網絡,從而提高了 MPI 操作的性能。這種方法減少了到達聚合節點時通過網絡的數據量,并顯著減少了 MPI 操作時間。

在網絡中實現集體通信算法還有其他好處,例如釋放寶貴的 CPU 資源用于計算,而不是使用它們來處理通信。

圖 1 NVIDIA SHARP 聚合架構框圖。

最近發布的 NVIDIA Quantum-2 InfiniBand 交換機為通過網絡的大型數據聚合提供了幾乎無限的可擴展性。由于支持無限的小消息縮減和每個交換機的多個大消息縮減流,跨共享系統運行應用程序的多個租戶現在可以充分利用 SHARP 的優勢。

Watch the In-Network Computing with NVIDIA SHARP Video.

性能隔離

多租戶超級計算涉及許多在共享基礎設施上運行的用戶應用程序,可能會重復使用物理服務器、存儲、網絡以及這些應用程序生成的 I / O 流量模式。

NVIDIA Quantum InfiniBand 在檢測到網絡擁塞時管理網絡擁塞,并在源位置實施控制以減少網絡擁塞。但使用多租戶,用戶應用程序可能不知道對相鄰應用程序流量的任意干擾,因此需要隔離以提供預期的性能級別。

借助最新的 NVIDIA Quantum-2 InfiniBand 平臺和 Magnum IO ,創新的主動監控和擁塞管理提供了所需的流量隔離。這幾乎消除了性能抖動,并確保了預期的預測性能,就像應用程序在專用系統上運行一樣。

pYYBAGJZFsmAYudXAABgOQ0GTXg079.png

圖 2 性能隔離的好處。

專為安全、多租戶、裸機性能而打造

NVIDIA Cloud-Native Supercomputing體系結構使用 Magnum IO 在多租戶環境中實現最高性能、安全性和編排。

poYBAGJZFtCAc_hCAAECd4tBFts823.png

圖 3 使用 DPU 遷移到云本機超級計算體系結構。

此外,實現這種架構轉換的另一個核心元素是數據處理單元( DPU ),也稱為 BlueField 。作為一個完全集成的片上數據中心平臺, BlueField 卸載和管理數據中心基礎設施,而不是主機處理器,實現超級計算機的安全和協調。它還能夠提供額外的通信框架卸載,產生 100% 的通信計算重疊,同時實現 MPI _ Alltoall 44% 的性能提升和 MPI _ iAllgather 36% 的性能提升。當結合 NVIDIA Quantum-2 的最新進展時,該體系結構在安全的多節點體系結構中展示了裸機性能的性能隔離。

Magnum IO 消除了 I / O 瓶頸,并公開了硬件級加速引擎、網絡計算和擁塞控制方面的最新技術,這些技術是支持當今具有裸機性能的多租戶數據中心所必需的。

關于作者

Scot Schultz 是 HPC 技術專家,專注于人工智能和機器學習系統。 Scot 在分布式計算、操作系統、人工智能框架、高速互連和處理器技術方面擁有廣泛的知識。在他的整個職業生涯中,擁有超過 25 年的高性能計算系統經驗,他的職責包括各種工程和領導角色,包括戰略 HPC 技術生態系統支持。 Scot 在眾多行業標準組織的成長和發展中發揮了重要作用。

Harry Petty 是一位經驗豐富的數據中心營銷人員和技術專家,曾在大型科技公司擔任領導職務,為混合云、存儲解決方案、網絡處理器和服務器產品線推廣 SDN 產品。他曾與許多客戶合作,在多個數據中心部署應用程序。當 Harry 不討論 HPC 數據中心的 IO 子系統時,他喜歡在北加利福尼亞州附近的 Sierra 山麓和湖泊中進行戶外活動。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據中心
    +關注

    關注

    16

    文章

    5146

    瀏覽量

    73219
  • 人工智能
    +關注

    關注

    1804

    文章

    48737

    瀏覽量

    246664
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134122
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    揭秘計算架構的分層奧秘

    的重要基石。那么,計算架構究竟是如何構建的呢?今天,我們帶您揭秘計算架構的分層奧秘——邊緣層
    的頭像 發表于 02-26 17:41 ?389次閱讀

    HPC計算的技術架構

    HPC計算結合了HPC的強大計算能力和計算的彈性、可擴展性,為用戶提供了按需獲取高性能計算
    的頭像 發表于 02-05 14:51 ?337次閱讀

    物聯網IO模塊是什么

    物聯網IO模塊,作為工業自動化領域中的關鍵組件,扮演著數據傳輸與控制的核心角色。一種具有通信功能的數據采集與傳送模塊,主要負責將現場的各種信號轉換為數字或模擬信號,并傳輸至平臺,或者接收來自
    的頭像 發表于 01-21 16:57 ?438次閱讀

    什么是計算平臺?搭建計算平臺需要什么條件

    計算平臺是一種以計算技術為基礎的計算服務平臺,用于提供靈活、可擴展、可共享的
    的頭像 發表于 01-09 10:43 ?394次閱讀

    聯發科與NVIDIA合作 為NVIDIA 個人AI超級計算機設計NVIDIA GB10超級芯片

    聯發科近日宣布與NVIDIA合作設計NVIDIA GB10 Grace Blackwell超級芯片,將應用于NVIDIA 的個人AI超級計算機NVIDIA? Project DIGIT
    的頭像 發表于 01-07 16:26 ?519次閱讀

    計算HPC軟件關鍵技術

    計算HPC軟件關鍵技術涉及系統架構、處理器技術、操作系統、計算加速、網絡技術以及軟件優化等多個方面。下面,AI部落小編帶您探討
    的頭像 發表于 12-18 11:23 ?390次閱讀

    云端超級計算機使用教程

    云端超級計算機是一種基于計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向
    的頭像 發表于 12-17 10:19 ?490次閱讀

    計算和HPC的關系

    盡管計算和HPC在架構、應用場景和成本效益等方面存在顯著差異,但計算和HPC之間并非孤立存在,而是相互補充、協同發展的關系。下面,AI部
    的頭像 發表于 12-14 10:35 ?401次閱讀

    λ-IO:存儲計算下的IO棧設計

    動機和背景? ? 存儲計算存儲資源的充分利用。IO棧是管理存儲器的的基本組件,包括設備驅動、塊接口層、文件系統,目前一些用戶空間IO庫(如SPDK)有效降低了延遲,但是io棧仍然不可或
    的頭像 發表于 12-02 10:35 ?560次閱讀
    λ-<b class='flag-5'>IO</b>:存儲<b class='flag-5'>計算</b>下的<b class='flag-5'>IO</b>棧設計

    云端超級計算機怎么用

    云端超級計算機是一種基于計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向
    的頭像 發表于 10-18 10:14 ?421次閱讀

    AI平臺與傳統計算的區別

    AI平臺與傳統計算在定義、技術架構、應用場景和服務模式等方面存在顯著差異。
    的頭像 發表于 10-14 10:08 ?810次閱讀

    解析一體式IO與分布式IO:從架構到應用

    在工業自動化領域,IO(輸入/輸出)系統扮演著舉足輕重的角色。它們不僅負責數據的采集和控制指令的發送,還直接影響到系統的靈活性、可靠性和成本效益。明達技術將為您介紹一體式IO和分布式IO架構
    的頭像 發表于 10-08 10:02 ?716次閱讀
    解析一體式<b class='flag-5'>IO</b>與分布式<b class='flag-5'>IO</b>:從<b class='flag-5'>架構</b>到應用

    如何理解計算

    據的安全性。 **高性能計算:**計算平臺提供高性能的計算資源,用于處理復雜的科學和工程計算
    發表于 08-16 17:02

    一體式IO與分布式IO:工業控制系統的兩種架構

    一體式IO與分布式IO架構各有優勢和局限性。選擇合適的IO架構需要根據實際的生產需求、系統規模、成本預算和維護能力綜合考慮。隨著工業自動化技
    的頭像 發表于 07-17 16:12 ?1936次閱讀
    一體式<b class='flag-5'>IO</b>與分布式<b class='flag-5'>IO</b>:工業控制系統的兩種<b class='flag-5'>架構</b>

    計算與企業IT成本治理

    時至今日,計算已逐步替代傳統IT中服務器、存儲、虛擬化等單體軟硬件的IT架構,成為企業IT能力中最重要的組成部分。企業在利用計算帶來的便
    的頭像 發表于 06-19 09:40 ?869次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>計算</b>與企業IT成本治理