女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達GPU Direct不可或缺的RMDA技術到底有多厲害?

SSDFans ? 來源:楊湘祁 ? 作者:電子發燒友 ? 2019-03-01 13:48 ? 次閱讀

和娛樂圈的明星八卦一樣,IT行業里面的各種并購也是非常有市場的。畢竟,像EMC,Cisco,Broadcom 這樣的公司都是一路并購成長起來的。最近比較熱門的應該是Mellanox說自己準備賣自己了。在25G/50G/100G市場上占據了69%的市場份額,2018年前三個季度,出貨了2.1M的網絡端口。[1] 這么好的標的,一時各種傳聞都出來了。Xilinx[2],Microsoft[3],Intel[4],估計還有Broadcom[5]都在準備,以色列人的確有水平,已經從5.5B到了6B。陳福陽在華爾街籌錢的能力,估計還有大招。

Mellanox是個什么公司,一句話,就是目前RDMA技術的事實的技術定義者。雖然海有很多公司也有RDMA技術,但是在IB和Ethernet兩個市場都能夠呼風喚雨,只有它了。

Remote DMA技術在Ethernet上的應用不能不提微軟,目前微軟是目前在數據中心大規模部署RDMA的第一家HyperScale公司。微軟在2015/6/7/8年的Sigcomm [6]有大量的論文來講RDMA在數據中心的部署,很多人講微軟的風格是自己做了100分,但是對外只講1分。因此可以想象Microsoft對于Mellanox準備賣身的關注,自己的技術投入不能打水漂,不僅自己下手,而且鼓勵合作伙伴一起團購。

RDMA的技術是在一個有Mellanox主導的行業組織OFA[7]主導的。目前的成員如下圖,可以看到還是集中在HPC的專業領域。

英偉達GPU Direct必不可少的RMDA技術到底有多厲害?

OFA是2004年成立的工業組織,在整個HPC行業從Myrinet[8]轉換到IB的時候成立的。在2005年, Myrinet在TOP500的市場份額占到了28%,之后就一路下降,被IB替換掉了。對于誕生于HPC專業的領域,可用性一直是個大問題,HPC一切為了性能,不要虛擬化,不要通用操作系統和架構,每臺超算恨不得自成一臺體系。大家看看Mellanox的Linux 驅動的家族就知道這個有多復雜了。[7]

這路吐一個槽,作為Mellanox卡的資深用戶,我很早就自己畫了一份他們的OFED驅動的加載流程,作為Mellanox,這么基本的文檔在2018年12月才發布,而且很多模塊沒有upstream,讓人無奈的是,到現在為止我還沒有找到卸載rdma_cm ( connection mangament ) 的有效方法。每次都需要重啟

因此看到AWS說要發布他們的EFA的時候,覺得他們還是真有勇氣,但是仔細一看,原來和AWS的HPC業務緊密結合,而且利用了libfabric 的生態[8]

很明顯,libfabric在網路傳輸層和流行的HPC編程框架之間做了一個統一。更重要的是,對于原來OFA的功能定義做了一個大大減法。俺曾經自己研究總結了Mellanox CX系列網卡的功能。大家可以自己看看這個復雜度。

對于像AWS這樣的Hyperscale公司也要部署RDMA,這個做法和之前的微軟有很大的不同。對于微軟,他們從40G開始規模部署RDMA,就是為了Azure的云環境的低延時網絡,目前微軟的網絡還是天下第一。[9]當然微軟為了大規模部署RoCEv2的所作的各種流控算法以及應用的優化對于整個業界都是非常有用的,但是他們主要停留在傳統的網絡上面。

AWS則不同,對于低延時網絡來講,在2014年之前,大部分的場景就是SDS,太多的存儲startup公司,使用PCIE Flash和RDMA 網卡來構建自己的分布式存儲系統,比較典型就是EMC收購的ScaleI/O了。[10]

2014年之后,由于ALexnet的出色表現,RMDA和Nvidia有了深度合作,利用GPU Direct,在GPU集群中快速傳遞數據成了RDMA的另一個

大眾應用。[11]

GPU+RDMA也是目前在TOP500部署量最大的應用,因此可以很明確地看出AWS使用Nitro做EFA的目的了。

貌似只有一款機型部署了EFA。[12] 對于這個機型,定位很清楚,HPC和分布式機器學習的訓練,因此功能實現也非常有目的,不要指望EFA會和Mellanox一樣功能強大。

因此,可以看出,傳統的Nitro芯片在升級了25G的Serdes之后,利用libfabric的生態實現了部分的RDMA的功能,可以滿足AWS上的HPC和ML的業務需求。這個和國內的大廠的想法類似。

因此,對于未來RDMA在數據中心的使用場景,存儲和HPC是兩個比較明確的方向。對于存儲,如何和NVMe這樣的存儲介質,以及NVMeoF和Cephover RDMA這樣的存儲后端結合是一個方向,在這個方向上,是不是要支持IB的編程框架并不重要。對于HPC的方向,則是如何和GPU這樣的計算引擎結合,簡單數據傳輸的延時,和上層的ML的框架緊密結合。

廣告時間: Xilinx在2018.1 中就推出了自己的RDMA的實現,目前主要關注在存儲應用這個方向。[13]實現了對10G/25G/40G/100G的網絡速率的支持,在Vivado 2019.1中會在延時上有進一步的提升,在512Byte上和標準的Mellanox類似,當然我們也是兼容Mellanox。歡迎大家垂詢。

[1]https://www.businesswire.com/news/home/20181025005197/en/Mellanox-Ships-2.1-Million-Ethernet-Adapters-Quarters

[2]https://www.cnbc.com/2018/11/07/xilinx-working-with-barclays-to-buy-mellanox-possible-december-deal.html

[3]https://www.cbronline.com/news/microsoft-mellanox

[4]https://www.hpcwire.com/2019/01/30/intel-reportedly-in-6b-bid-for-mellanox/

[5]https://en.globes.co.il/en/article-mellanox-acquisition-fits-broadcom-like-a-glove-1001258241

[6]http://www.sigcomm.org/

[7]https://community.mellanox.com/s/article/mellanox-linux-driver-modules-relationship--mlnx-ofed-x

[8]https://ofiwg.github.io/libfabric/

[9]https://mspoweruser.com/report-microsoft-azure-beats-google-cloud-and-amazon-aws-in-network-performance/

[10]https://en.wikipedia.org/wiki/Dell_EMC_ScaleIO

[11]https://devblogs.nvidia.com/benchmarking-gpudirect-rdma-on-modern-server-platforms/

[12]https://aws.amazon.com/cn/ec2/instance-types/

[13]https://www.xilinx.com/products/intellectual-property/etrnic.html

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3922

    瀏覽量

    93134

原文標題:深度好文:RDMA,到底有多厲害?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    GPU 維修干貨 | 英偉 GPU H100 常見故障哪些?

    上漲,英偉H100GPU憑借其強大的算力,成為AI訓練、高性能計算領域的核心硬件。然而,隨著使用場景的復雜化,H100服務器故障率也逐漸攀升,輕則影響業務進度,重
    的頭像 發表于 05-05 09:03 ?408次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>GPU</b> H100 常見故障<b class='flag-5'>有</b>哪些?

    實測 PTR54LS05低功耗到底有

    實測 PTR54LS05低功耗到底有低?
    發表于 04-27 10:57

    為何原理圖比對是電子設計中不可或缺的功能?

    為何原理圖比對是電子設計中不可或缺的功能?原理圖比對功能是現代電子設計流程中不可或缺的一部分,能夠提高設計的準確性、效率和協作能力。它不僅能夠幫助團隊在設計階段減少錯誤,還能在后期的維護和版本管理中
    的頭像 發表于 03-10 11:02 ?439次閱讀
    為何原理圖比對是電子設計中<b class='flag-5'>不可或缺</b>的功能?

    BGA芯片封裝:現代電子產業不可或缺技術瑰寶

    不可或缺的一部分。本文將深入探討BGA芯片的定義、特點以及BGA封裝工藝的詳細流程,為讀者揭開這一先進封裝技術的神秘面紗。
    的頭像 發表于 12-13 11:13 ?3017次閱讀
    BGA芯片封裝:現代電子產業<b class='flag-5'>不可或缺</b>的<b class='flag-5'>技術</b>瑰寶

    高鐵站網約車數智出行到底有智能?

    在當今這個科技飛速發展的時代,智能出行已成為我們日常生活中不可或缺的一部分,而高鐵站網約車數智出行更是將這一理念推向了新的高度。那么,這種數智出行方式到底有智能呢? 首先,從預約叫車開始,高鐵站網
    的頭像 發表于 11-14 14:48 ?533次閱讀

    軟銀升級人工智能計算平臺,安裝4000顆英偉Hopper GPU

    軟銀公司宣布,其正在擴展的日本頂級人工智能計算平臺已安裝了約4000顆英偉Hopper GPU。這一舉措顯著提升了平臺的計算能力。據悉,該平臺自2023年9月開始運行,最初配備了大約2000顆
    的頭像 發表于 11-04 16:18 ?758次閱讀

    RTOS與Linux到底有什么區別

    很多做嵌入式開發的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區別?
    的頭像 發表于 10-29 09:53 ?1105次閱讀

    Inflection AI轉向英特爾Gaudi 3,放棄英偉GPU

    近日,人工智能技術公司Inflection AI宣布了一項重要決策,其最新的企業平臺將放棄采用英偉(Nvidia)的GPU,轉而選擇英特爾的Gaudi 3加速器。
    的頭像 發表于 10-10 17:21 ?710次閱讀

    挑戰英偉:聚焦本土GPU領軍企業崛起

    在全球圖形處理單元(GPU)市場的霸主地位,特別是其關鍵硬件對訓練大型AI模型(如ChatGPT背后的OpenAI模型)的不可或缺性,中國正積極尋求突破。盡管英偉
    的頭像 發表于 09-18 15:24 ?1003次閱讀

    ARM進軍GPU領域,挑戰英偉與英特爾

    英國芯片設計巨頭ARM正悄然在以色列拉阿納納的研發中心布局其GPU(圖形處理器)戰略,意圖在全球圖形處理市場與英偉和英特爾等業界巨頭一較高下。據悉,ARM已在該開發中心組建了一支由約100名精英芯片與軟件工程師構成的全球圖形處
    的頭像 發表于 08-21 10:19 ?783次閱讀

    英偉將全面轉向開源GPU內核模塊

    英偉公司近期宣布了一項重大決策,即全面轉向開源GPU內核模塊,并計劃最終以此取代閉源驅動程序。這一戰略轉變標志著英偉在開源領域邁出了重要
    的頭像 發表于 07-19 15:26 ?800次閱讀

    英偉數據中心GPU出貨量飆升,市場份額持續領跑

    在全球半導體和計算技術不斷革新的浪潮中,英偉(NVIDIA)再次憑借其卓越的技術實力和市場洞察力,在數據中心GPU領域取得了令人矚目的成績
    的頭像 發表于 06-13 17:08 ?1795次閱讀

    英偉GPU新品規劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉(NVIDIA)公布了其GPU產品的未來規劃。據英偉透露,B100、B200和GB200系列
    的頭像 發表于 06-13 09:44 ?1213次閱讀

    英偉去年數據中心GPU出貨量占比約98%

    半導體分析公司TechInsights的最新報告揭示了英偉在數據中心GPU領域的驚人增長。據悉,在2023年,英偉在數據中心
    的頭像 發表于 06-12 16:06 ?838次閱讀

    8針M16接頭中不可或缺的關鍵組件

      德索工程師說道8針M16接頭作為電氣連接的重要組件,其內部結構和關鍵組件共同確保了其高效、穩定的電氣連接性能。以下是對8針M16接頭中不可或缺的關鍵組件的詳細解析,結合參考文章中的相關數字和信息進行闡述:
    的頭像 發表于 06-11 18:05 ?556次閱讀
    8針M16接頭中<b class='flag-5'>不可或缺</b>的關鍵組件