女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新一代AI/ML加速器新型內存解決方案——HBM2E內存接口

454398 ? 來源:電子技術設計 ? 作者:邵樂峰 ? 2020-10-23 15:20 ? 次閱讀

近年來,隨著內存帶寬逐漸成為影響人工智能持續增長的關鍵焦點領域之一,以高帶寬內存(HBM、HBM2、HBM2E)和GDDR開始逐漸顯露頭角,成為搭配新一代AI/ML加速器和專用芯片的新型內存解決方案。

人工智能/機器學習(AI/ML)在全球范圍內的迅速興起,正推動著制造業、交通、醫療、教育和金融等各個領域的驚人發展。從2012年到2019年,人工智能訓練能力增長了30萬倍,平均每3.43個月翻一番,就是最有力的證明。支持這一發展速度需要的遠不止摩爾定律,人工智能計算機硬件和軟件的各個方面都需要不斷的快速改進。

2012-2019年,人工智能訓練能力增長30萬倍(圖片來源:openai.com)

而中國作為全球人工智能發展最快的國家之一,正備受矚目。根據德勤最新發布的統計預測數據顯示,2020年全球人工智能市場規模將達到6800億元人民幣,復合增長率(CAGR)達26%。而中國人工智能市場的表現尤為突出,2019年末已經達到了510億元人民幣的市場規模,人工智能企業超過2600家。預計到2020年,中國AI市場規模將達到710億元人民幣,五年間(2015-2020)的復合增長率高達44.5%。

近年來,中國正在積極推動人工智能與實體經濟的融合,從而實現產業的優化升級。2017年7月,國務院印發了《新一代人工智能發展規劃》,這一規劃與2015年5月發布的《中國制造2025》共同構成了中國人工智能戰略的核心。這份具有里程碑意義的規劃,對人工智能發展進行了戰略性部署,力爭到2030年把中國建設成為世界主要人工智能創新中心。此外,2020年還是中國的新基建元年,而人工智能作為一大重點板塊,勢必成為新基建的核心支撐。

內存帶寬將是影響AI發展的關鍵因素

“內存帶寬將成為人工智能持續增長的關鍵焦點領域之一。”Rambus IP核產品營銷高級總監 Frank Ferro日前在接受《電子工程專輯》采訪時表示,以先進的駕駛員輔助系統(ADAS)為例,L3級及更高級別系統的復雜數據處理需要超過200GB/s的內存帶寬。這些高帶寬是復雜AI/ML算法的基本需求,自駕過程中需要這些算法快速執行大量計算并安全地執行實時決策。而在L5級,如果車輛要能夠獨立地對交通標志和信號的動態環境做出反應,以便準確地預測汽車、卡車、自行車和行人的移動,將需要超過500GB/s的內存帶寬。

不同ADAS級別對存儲帶寬的要求(圖片來源:anandtech.com)

鑒于此,高帶寬內存(HBM、HBM2、HBM2E)和GDDR開始逐漸顯露頭角,成為搭配新一代AI/ML加速器和專用芯片的新型內存解決方案。他說過去幾年內,HBM、HMC、PAM4等標準在市場上展開了激烈的競爭,但從目前的發展態勢來看,還是HBM占據了更多的市場份額。不過他同時也坦承,由于汽車安全等級要求很高,考慮到HBM本身采用的是復雜的2.5D架構,再結合DRAM設備,所以目前為止在汽車市場上并沒有得到突破性的應用,相比之下,GDDR反而會是比較好的解決方案。

高帶寬內存(HBM)于2013年推出,是一種高性能3D堆棧SDRAM構架。與前一代產品一樣,HBM2為每個堆棧包含最多8個內存芯片,同時將管腳傳輸速率翻倍,達到2Gbps。HBM2實現每個封裝256GB/s的內存帶寬(DRAM堆棧),采用HBM2規格,每個封裝支持高達8GB的容量。

2018年末,JEDEC宣布推出HBM2E規范,以支持增加的帶寬和容量。當傳輸速率上升到每管腳3.6Gbps時,HBM2E可以實現每堆棧461GB/s的內存帶寬。此外,HBM2E支持12個DRAM的堆棧,內存容量高達每堆棧24GB。

單一DRAM堆棧的HBM2E內存系統(圖片來源:Rambus)

HBM2E提供了達成巨大內存帶寬的能力。連接到一個處理器的四塊HBM2E內存堆棧將提供超過1.8TB/s的帶寬。通過3D堆疊內存,可以以極小的空間實現高帶寬和高容量需求。進一步,通過保持相對較低的數據傳輸速率,并使內存靠近處理器,總體系統功率得以維持在較低水位。

坦率的說,采用HBM的設計的代價是增加復雜性和成本,因此Frank Ferro并不建議在人工智能推理應用中使用HBM技術。然而,對于人工智能訓練應用,HBM2E的優點使其成為一個更好的選擇。它的性能非常出色,所增加的采用和制造成本可以透過節省的電路板空間和電力相互的緩解。在物理空間日益受限的數據中心環境中,HBM2E緊湊的體系結構提供了切實的好處。它的低功率意味著它的熱負荷較低,在這種環境中,冷卻成本通常是幾個最大的運營成本之一。官方數據顯示,Rambus IP系統以及IP產品在實驗室經過了非常嚴苛的環境測試,確保從零下50到125攝氏度范圍內均能夠正常運行。

同時,Frank Ferro也不認為在芯片上采取分布式內存的方法會給HBM2E和GDDR長期的發展帶來影響。原因在于盡管SRAM的速度和延遲性都高于DRAM,但在固定的芯片面積上能安裝的SRAM數量卻非常少,很多情況下為了滿足人工智能訓練的需求,一部分SRAM設備不得不裝在芯片之外,這就是問題所在。但總體來說,這兩種方案屬于從不同角度出發解決同一個問題,兩者之間是互補而非相互阻礙。

創紀錄的性能

針對高帶寬和低延遲進行了優化,Rambus HBM2E內存接口解決方案實現了創紀錄的4Gbps性能。該解決方案由完全集成且經過驗證的PHY和內存控制器IP組成,搭配SK Hynix 3.6Gbps運行速度的HBM2E DRAM,在物理層面實現了完整的集成互聯,可以從單個HBM2E設備提供460GB/s的帶寬,這也被Frank Ferro視作其HBM2E 產品的核心差異化優勢之一。這意味著,除了提供完整的內存子系統、硬核PHY和時序收斂外,用戶額外需要的系統級支持、工具套件和技術服務也都包含在內,集成難度和設計時間得以大幅度下降。

Rambus HBM2E 4Gbps發送端眼圖(圖片來源:Rambus)

從2017年正式投產HBM解決方案以來,Rambus目前已經擁有第三代PHY和第二代內存控制器IP,全球范圍內的成功案例項目超過50個。除了4Gbps HBM2E外,Rambus在其他不同工藝節點的產品還包括采用Global Foundries 12nm/14nm工藝的HBM2,速度為2.0 Gbps/s;采用Global Foundries 12LP+和三星14nm/11nm工藝的HBM2E產品。

不可否認,4.0Gbps是一個全新的行業標桿。在這一過程中,Rambus與SK hynix和Alchip展開了合作,采用臺積電N7工藝和CoWoS?先進封裝技術,實現了HBM2E 2.5D系統在硅中驗證Rambus HBM2E PHY和內存控制器IP。Alchip與Rambus的工程團隊共同設計,負責中介層和封裝基板的設計。

“在我們提供的完整參考設計框架中,最重要的一點就是如何更好地對中介層進行完整的設計和表征化處理,以確保信號完整性。此外,我們還協助用戶對每個信號通道進行仿真分析,通過Lab Station工具對內存子系統進行最優化設計,并提供在SI高速信號完整性和電源完整性方面的經驗等等。”Frank Ferro說Rambus的初衷,不僅僅只是扮演IP供應商的角色,更是希望在系統層面降低用戶設計難度。

信號完整性之所以如此重要,是因為HBM作為高速內存接口,在與中介層互聯的過程中包括至少上千條不同的數據鏈路,必須要確保所有鏈路的物理空間得到良好的控制,整個信號的完整性也必須得到驗證。因此,Rambus的做法如果從表征化層面來講,不但需要對整個中介層的材料做出非常精細的選擇,還要考慮漸進層的厚度以及整個電磁反射相關的物理參數,并在此基礎上進行完整的分析和仿真,以實現信號一致性的處理。

HBM2E內存接口子系統示例

燧原科技是Frank Ferro在發布會上提及的中國合作伙伴。在此次合作中,燧原科技為自己下一代人工智能訓練芯片選擇了Rambus HBM2 PHY和內存控制器IP,可實現2Tb/s的性能。而在今年4月和5月,長鑫存儲、兆易創新兩家公司還分別和Rambus簽署了DRAM(動態隨機存取存儲)與RRAM(電阻式隨機存取存儲器,也可寫作ReRAM)技術專利授權。

Rambus大中華區總經理 Raymond Su表示,通過對IP控制器公司Northwest Logic和Verimatrix安全IP業務部門的收購,Rambus實現了在內存IP層面提供一站式采購和“turn key”服務的目標。接下來,在中國市場,公司將緊密地與云廠商、OEM和ODM合作,推動整個內存產業生態系統的建設。

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DRAM
    +關注

    關注

    40

    文章

    2342

    瀏覽量

    185160
  • 信號完整性
    +關注

    關注

    68

    文章

    1432

    瀏覽量

    96433
  • AI
    AI
    +關注

    關注

    87

    文章

    34172

    瀏覽量

    275330
  • 人工智能
    +關注

    關注

    1804

    文章

    48691

    瀏覽量

    246406
  • adas
    +關注

    關注

    310

    文章

    2239

    瀏覽量

    209861
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Cadence推出HBM4 12.8Gbps IP內存系統解決方案

    近日,Cadence(NASDAQ:CDNS)近日宣布推出業界速度最快的 HBM4 12.8Gbps 內存 IP 解決方案,以滿足新一代 AI
    的頭像 發表于 05-26 10:45 ?395次閱讀

    SK海力士加速16Hi HBM3E內存量產準備

    近日,SK海力士正全力加速其全球首創的16層堆疊(16Hi)HBM3E內存的量產準備工作。這創新產品的全面生產測試已經正式啟動,為明年初的樣品出樣乃至2025年上半年的大規模量產與供
    的頭像 發表于 12-26 14:46 ?591次閱讀

    意法半導體發布新一代微控制,集成NPU加速器推動邊緣AI

    全球領先的半導體公司意法半導體(STMicroelectronics,簡稱ST)近日宣布推出全新系列微控制,這是其首款集成機器學習(ML)加速器的產品。此舉標志著意法半導體在推動邊緣人工智能(
    的頭像 發表于 12-23 18:13 ?845次閱讀

    英偉達AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存

    加速器設計的愿景。 英偉達認為未來整個 AI 加速器復合體將位于大面積先進封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設計,3D 垂直堆疊 DRAM 內存
    的頭像 發表于 12-13 11:37 ?559次閱讀
    英偉達<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM <b class='flag-5'>內存</b>

    特斯拉欲將HBM4用于自動駕駛,內存大廠加速HBM4進程

    Dojo的性能。Dojo超級電腦是特斯拉用于自動駕駛技術開發和訓練的重要工具,需要高存儲帶寬來處理大量數據和復雜計算任務。據稱,目前特斯拉汽車主要配備了HBM2E芯片。 ? 而今年10月有消息表示,SK海力士在汽車內存領域取得
    的頭像 發表于 11-28 00:22 ?2512次閱讀

    英偉達加速認證三星AI內存芯片

    近日,英偉達公司正在積極推進對三星AI內存芯片的認證工作。據英偉達CEO透露,他們正在不遺余力地加速進程,旨在盡快將三星的內存
    的頭像 發表于 11-25 14:34 ?520次閱讀

    貿澤開售適用于高性能計算應用的AMD Alveo V80加速器

    產品搭載高性能的AMD Versal? HBM自適應片上系統 (SoC),集成了速度更快的高帶寬內存 (HBM2e DRAM),能克服高性能計算 (HPC) 應用中的內存瓶頸問題,這些
    發表于 09-27 14:59 ?323次閱讀

    美光12層堆疊HBM3E 36GB內存啟動交付

    美光科技近期宣布,其“生產可用”的12層堆疊HBM3E 36GB內存已成功啟動交付,標志著AI計算領域的大飛躍。這款先進內存正陸續送達主要
    的頭像 發表于 09-09 17:42 ?1048次閱讀

    三星電子HBM3E內存獲英偉達認證,加速AI GPU市場布局

    為英偉達H200系列AI GPU的首選內存解決方案,同時,針對英偉達Blackwell系列的驗證工作也在緊鑼密鼓地進行中,預示著雙方合作的進步深化。
    的頭像 發表于 09-05 17:15 ?955次閱讀

    三星HBM3E內存挑戰英偉達訂單,SK海力士霸主地位受撼動

    進入八月,市場傳言四起,韓國存儲芯片巨頭三星電子(簡稱“三星”)的8層HBM3E內存新一代高帶寬內存產品)已順利通過英偉達嚴格測試。然而,三星迅速澄清,表示這
    的頭像 發表于 08-23 15:02 ?969次閱讀

    HBM上車?HBM2E被用于自動駕駛汽車

    電子發燒友網報道(文/黃晶晶)日前,韓媒報道SK海力士副總裁Kang Wook-sung透露,SK海力士HBM2E正用于Waymo自動駕駛汽車,并強調SK海力士是Waymo自動駕駛汽車這項先進內存
    的頭像 發表于 08-23 00:10 ?7205次閱讀

    SK海力士攜手Waymo提供第三高帶寬存儲(HBM2E)技術

    據最新消息,SK海力士正攜手Waymo,為其標志性的自動駕駛汽車項目“谷歌汽車”提供前沿的第三高帶寬存儲HBM2E)技術。這合作預示著隨著自動駕駛技術的日益普及,
    的頭像 發表于 08-15 14:54 ?1459次閱讀

    一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

    電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級
    發表于 08-15 11:06 ?0次下載
    下<b class='flag-5'>一代</b>高功能<b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統高級<b class='flag-5'>AI</b>中更快的嵌入處理

    SK海力士攜手臺積電,N5工藝打造高性能HBM4內存

    在半導體技術日新月異的今天,SK海力士再次引領行業潮流,宣布將采用臺積電先進的N5工藝版基礎裸片來構建其新一代HBM4內存。這舉措不僅標志著SK海力士在高性能存儲
    的頭像 發表于 07-18 09:47 ?893次閱讀

    集成32GB HBM2e內存,AMD Alveo V80加速卡助力傳感處理、存儲壓縮等

    電子發燒友網報道(文/黃晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自適應SoC搭配HBM,可處理計算以及內存密集型的工作負載,用于高性能計算、數據分析、金融科技、存儲壓縮
    的頭像 發表于 06-05 16:16 ?2627次閱讀
    集成32GB <b class='flag-5'>HBM2e</b><b class='flag-5'>內存</b>,AMD Alveo V80<b class='flag-5'>加速</b>卡助力傳感<b class='flag-5'>器</b>處理、存儲壓縮等