女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

進一步了解大規模部署AI的更優解:Habana? Gaudi?2

英特爾中國 ? 來源:未知 ? 2023-07-21 18:15 ? 次閱讀

大語言模型(Large Language Model,下文簡稱為:LLM)的發展如火如荼。以ChatGPT為代表的LLM可執行更為廣泛的任務并具有更高的智能化程度,刷新了人們對AI技術的新認知。當然,LLM規模龐大,通常包含數十億參數,需要海量的訓練數據與強大算力支撐才能達到預期的效果。

其實,無論LLM還是其他應用越來越廣泛的深度學習模型,從模型訓練到推理應用,都需要高性能、可擴展的基礎設施作為底層支撐,這往往也意味著高昂的成本。近日,英特爾發布的最新Habana Gaudi2,專為訓練大語言模型而構建,并為數據中心大規模擴展而設計,同時為深度學習訓練和推理工作負載提供極具性價比的解決方案。

在6月公布的MLCommonsMLPerf基準測中,Gaudi2在GPT-3模型、計算機視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了優異的訓練結果。與市場上其他面向大規模生成式AI和大語言模型的產品相比,Gaudi2擁有卓越的性能與領先的性價比優勢,能夠幫助用戶提升運營效率的同時,降低運營成本。

Gaudi2實現性能、可擴展性和能效飛躍

第二代Gaudi AI深度學習夾層卡 HL-225B 專為數據中心實現大規模橫向擴展而設計。其AI處理器基于第一代 Gaudi的高效架構打造而成,目前采用7納米制程工藝,在性能、可擴展性和能效方面均實現了飛躍。

夾層卡搭載的HL-2080 處理器擁有24個完全可編程的第四代張量處理器核心(TPC)。這些核心原生設計便能夠為廣泛的深度學習工作負載加速,同時還賦予用戶按需進行優化和創新的靈活性。此外,它還集成了96GB HBM2e內存和48MB SRAM,支持600瓦夾層卡級熱設計功耗(TDP)。

Gaudi2 處理器具備出色的2.1 Tbps 網絡容量可擴展性,原生集成21個100 Gbps RoCE v2 RDMA端口,可通過直接路由實現Guadi 處理器間通信。Gaudi2處理器集成了專用媒體處理器,用于圖像和視頻解碼及預處理。

此外,Gaudi2 深度學習夾層卡符合OCP OAM 1.1(開放計算平臺之開放加速器模塊)等多種規范,可以為客戶帶來系統設計的靈活性。

wKgZomToEiOAHhCbAANfFZZIFfw645.pngwKgZomToEiOAKQBNAADoVCpclaA981.png

圖:Gaudi2 深度學習夾層卡 HL-225B 主要參數

多維度技術創新,實現卓越性價比

Gaudi2 處理器是一款高性能、完全可編程的AI處理器,它整合了多項技術創新,從計算架構、內存和擴展能力三個維度打造全新的AI 專用處理器。同時,它具有高內存帶寬/容量和基于標準以太網技術的縱向擴展能力,支持使用外接網卡通過PCIe接口實現橫向擴展,滿足多節點集群需要。

[ 性能更高的計算架構 ]

Gaudi2 采用經過驗證的高性能深度學習AI訓練處理器架構,利用Habana完全可編程的TPC和GEMM引擎,支持面向AI的高級數據類型:FP8、BF16、FP16、TF32和FP32。TPC核心旨在支持深度學習訓練和推理工作負載。TPC是一款VLIW SIMD矢量處理器,其指令集和郵件經過定制,可高效處理上述工作負載。

[ 更先進的內存技術 ]

內存帶寬和容量與計算能力同樣重要。Gaudi2 采用先進的HBM內存技術,內存容量高達96GB,內存帶寬高達2.4TB/s。Gaudi先進的HBM控制器已針對隨機訪問和線性訪問進行了優化,在各種訪問模式下均可提供高內存帶寬。

[ 通過集成RDMA實現縱向擴展 ]

Gaudi AI訓練處理器芯片上集成了RDMA(RoCEv2),可與成熟且廣泛使用的以太網進行連接。HL-2080芯片互連技術基于42對56 Gbps Tx/Rx PAM4 SerDes(配置為21個100 GbE端口)發揮作用。

與廣泛的軟件生態一起,
幫助簡化模型的開發和遷移

為支持客戶輕松構建模型,或將當前基于GPU的模型業務和系統遷移到基于全新Gaudi2服務器,并幫助保護軟件開發投入,SynapseAI軟件套件針對Gaudi平臺深度學習業務進行了優化,旨在與廣泛的軟件生態系統一起,幫助簡化模型的開發和遷移。

SynapseAI 軟件套件旨在提高 Habana AI處理器的易用性和支持高性能訓練,能夠將神經網絡拓撲高效映射到Gaudi系列硬件上。該軟件套件包括Habana 的圖編譯器和運行時、經過性能優化的TPC算子庫、固件和驅動程序以及開放工具,例如用于自定義核心開發的TPC 編程工具套件和SynapseAI 圖編譯器。SynapseAI與TensorFlow和PyTorch等主流框架集成,并已針對基于Gaudi AI 處理器家族產品的訓練進行了優化。數據科學家和開發人員在這里可以找到開始基于Gaudi AI 處理器進行訓練所需的各類信息資料,包括教程、參考模型、操作指南、文檔等。

wKgZomToEiSACjlXAAGSCOwikSM850.jpg

擴展AI產品陣容,加速AI落地

Gaudi2不僅以高性能為AI模型的訓練與推理加速,其高擴展性和性價比,也將加速AI應用落地的進程。多年來,借助強大的軟硬件基礎,英特爾基于全面的AI產品和解決方案,與廣泛合作伙伴一同構建開放生態,為越來越多不同需求和場景的AI應用落地提供更多元的解決方案,持續引領產品技術發展,進一步加速大規模深度學習部署,助力中國本地AI市場發展。

wKgZomToEiSAIdlVAAJPLzW-Bdw902.jpg

想看更多“芯”資訊


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10169

    瀏覽量

    173956
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11038

    瀏覽量

    216031

原文標題:進一步了解大規模部署AI的更優解:Habana? Gaudi?2

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    ST EDGE AI云服務最后一步無法下載工程是怎么回事?

    ST EDGE AI云服務我選擇使用ST提供的模型,使用cube ai 9.0.0,選擇STM32板卡。之后就按照文檔一步一步操作,基準測試也能運行的到結果(說明云端是生成工程并編譯下
    發表于 03-13 08:17

    三星攜Galaxy AI和以軟件為中心的網絡技術亮相MWC 2025,進一步強化移動AI領先優勢

    3月3日-6日,世界移動通信大會(MWC2025)在巴塞羅那 Fira Gran Via展館舉行。本次大會上,三星電子進一步創新移動AI體驗,三星移動業務和網絡業務部門在現場展示了旗下包括下
    的頭像 發表于 03-05 15:43 ?305次閱讀
    三星攜Galaxy <b class='flag-5'>AI</b>和以軟件為中心的網絡技術亮相MWC 2025,<b class='flag-5'>進一步</b>強化移動<b class='flag-5'>AI</b>領先優勢

    迅為2K0300開發板進一步刨析,打造HMI體機產品的靈活優勢

    迅為2K0300開發板進一步刨析,打造HMI體機產品的靈活優勢
    的頭像 發表于 02-26 13:58 ?526次閱讀
    迅為<b class='flag-5'>2</b>K0300開發板<b class='flag-5'>進一步</b>刨析,打造HMI<b class='flag-5'>一</b>體機產品的靈活優勢

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發布了備受矚目的Janus Pro模型,其憑借超強性能和高精度在業界引發了廣泛關注。為了進一步提升該模型的應用效能,英特爾宣布其Gaudi 2D AI加速器已
    的頭像 發表于 02-10 11:10 ?551次閱讀

    DeepSeek發布Janus Pro模型,英特爾Gaudi 2D AI加速器優化支持

    Gaudi 2D AI加速器現已針對該模型進行了全面優化。這優化舉措使得AI開發者能夠更輕松地實現復雜任務的
    的頭像 發表于 02-08 14:35 ?563次閱讀

    AI與物聯網雙向奔赴,達實智能已在AI應用賽道先行一步

    進一步釋放 ? 2025年,生成式AI已經成為達實人有效的工作手段之。近期,達實智能開展了以AI應用賦能高效辦公為主題的企業培訓,從AI
    的頭像 發表于 01-13 10:39 ?638次閱讀

    華迅光通AI計算加速800G光模塊部署

    ,服務器之間的數據交換需要經過接入交換機、匯聚交換機和核心交換機。這給匯聚交換機和核心交換機帶來了巨大的工作壓力。 三層拓撲:如果采用傳統的三層拓撲,進一步擴大服務器集群的規模,則需要在核心層和匯聚層部署
    發表于 11-13 10:16

    臺積電擬進一步收購群創工廠擴產先進封裝

    據半導體設備公司的消息人士透露,臺積電正計劃進一步擴大其在先進封裝領域的產能。今年8月,臺積電已經收購了群創位于南科的5.5代LCD面板廠,而現在,市場消息稱臺積電有意收購更多群創在南科附近的工廠。
    的頭像 發表于 10-30 16:38 ?559次閱讀

    英特爾將進一步分離芯片制造和設計業務

    面對公司成立50年來最為嚴峻的挑戰,英特爾宣布了項重大戰略調整,旨在通過進一步分離芯片制造與設計業務,重塑競爭力。這決策標志著英特爾在應對行業變革中的堅定步伐。
    的頭像 發表于 09-19 16:48 ?565次閱讀

    通過展頻進一步優化EMI

    電子發燒友網站提供《通過展頻進一步優化EMI.pdf》資料免費下載
    發表于 09-04 09:32 ?1次下載
    通過展頻<b class='flag-5'>進一步</b>優化EMI

    RFTOP進一步擴充波導同軸轉換器產品線

    近日高品質微波毫米波器件供應商RFTOP(頻優微波)進一步擴充波導同軸轉換器產品線,新增了同軸公頭全系列新品,覆蓋1.0mm、1.85mm、2.4mm、2.92mm、SMA、SMP等同軸公頭,涵蓋
    的頭像 發表于 09-03 17:06 ?968次閱讀
    RFTOP<b class='flag-5'>進一步</b>擴充波導同軸轉換器產品線

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預計該服務將于2025年初正式上線。此次合作標志著兩家
    的頭像 發表于 09-03 15:52 ?593次閱讀

    支持電子設備進一步降低功耗的第5代平面型肖特基勢壘二極管

    ROHM第5代平面肖特基勢壘二極管的效率比上代產品又提高了25%,有助于進一步提高開關電源的效率。
    的頭像 發表于 08-09 15:21 ?1.4w次閱讀
    支持電子設備<b class='flag-5'>進一步</b>降低功耗的第5代平面型肖特基勢壘二極管

    iPhone 15在美國市場需求進一步減弱

    7月19日,國際媒體披露了市場研究機構CIRP的最新報告,揭示了iPhone 15系列在美國市場的受歡迎程度相較于前代iPhone 14系列有所下滑。這趨勢在CIRP最新發布的第二季度數據中得到了進一步印證,顯示iPhone 15系列的市場需求正經歷持續放緩。
    的頭像 發表于 07-19 16:11 ?876次閱讀

    Melexis推出全新MLX81123芯片,進一步擴展LIN RGB系列產品線

    Melexis近日宣布,作為汽車動態照明LED驅動芯片領域的領軍者,正式推出全新產品MLX81123,進一步擴展LIN RGB系列產品線。這款芯片在前代產品的基礎上進行深度優化,封裝設計更為緊湊
    的頭像 發表于 06-14 14:41 ?1027次閱讀