女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

爆紅智能AI如何看待DPU

芯啟源 ? 來源:芯啟源 ? 2023-02-10 14:30 ? 次閱讀

上線僅2個月,OpenAI的最新一代產品-AI聊天機器人ChatGPT月活用戶接近1億。

作為自然語言處理(NLP)領域的前沿研究成果之一,ChatGPT已成為AIGC里程碑式的產品。

這周我們也與ChatGPT聊了聊他/她對大規模預訓練背后所需資源的看法。

讓我們一起來看看ChatGPT的回答是否能讓你滿意呢?

9f63de06-a8df-11ed-bfe3-dac502259ad0.png

9f8cfb56-a8df-11ed-bfe3-dac502259ad0.png

9fb5eda4-a8df-11ed-bfe3-dac502259ad0.png

強大的語言生成能力現在引起更多討論的是規模預訓練。在過去的很長一段時間里,許多的AI廠商都是通過本地設備來進行訓練的。

GPT-3所訓練的參數約為1750億個,這部分需要大量的算力,而目前我們已知ChatGPT導入了至少1萬顆英偉達高端GPU來訓練模型。

a0011ebe-a8df-11ed-bfe3-dac502259ad0.png

a01a0bf4-a8df-11ed-bfe3-dac502259ad0.png

a034200c-a8df-11ed-bfe3-dac502259ad0.png

業界部分專家認為GPT-4訓練參數可能會達到100萬億個參數,如此大規模、長時間的GPU集群訓練任務,也對網絡互聯底座的性能、可靠性、成本等各方面都提出了極致的要求。

面對千億、萬億參數規模的大模型訓練,僅僅是單次計算迭代內梯度同步需要的通信量就高達TB量級。此外還有各種并行模式、加速框架引入的通信需求,使得傳統低速網絡的帶寬遠遠無法支撐GPU集群的高效計算,甚至成為了其中關鍵的瓶頸。

因此要充分發揮GPU計算資源的強大算力,必須構建一個全新的高性能網絡底座,用高速網絡的大帶寬來助推整個集群計算的高效率。

a0b178ae-a8df-11ed-bfe3-dac502259ad0.png

a0e8cb24-a8df-11ed-bfe3-dac502259ad0.png

CPU+GPU的異構計算模型已經成為高性能計算領域中的主流計算架構。而高吞吐、低延時是高性能計算場景中最為迫切的應用需求。

a124efc8-a8df-11ed-bfe3-dac502259ad0.png

a14629cc-a8df-11ed-bfe3-dac502259ad0.png

a1dac668-a8df-11ed-bfe3-dac502259ad0.png

我們可以知道,GPUDirect RDMA是RDMA在異構計算場景中的應用延伸,使得GPU之間的通信不在依賴CPU轉發,從而進一步提升高性能計算場景中整體算力。

從DPU芯片的實現角度看,不同DPU廠商的核心競爭壁壘在于專用加速引擎的硬件實現上。由于DPU是數據中心中所有服務器的流量入口,并以處理報文的方式處理數據,在網絡芯片領域積累更多的廠商將更有優勢。

a1fea060-a8df-11ed-bfe3-dac502259ad0.png

傳統的GPU在訪問存儲時,需要將數據先搬移到系統內存,再由系統內存搬移到目標設備。而采用DPU介入后可以繞過CPU,直接通過PCIe訪問遠端的NVMe設備,加速AI訓練,大大降低CPU的開銷。

在AI/ML領域的工作負載對于存儲系統的要求十分苛刻,目前此類應用已主要采用全閃存存儲,其中NVMe全閃存逐漸成為主流趨勢。同時存儲與前端應用主機的網絡存儲協議開始采用NVMe over Fabrics(NVMe-oF)。

NVMe-oF是一種存儲網絡協議,通過網絡將NVMe命令傳送到遠程NVMe子系統,以利用NVMe 全閃存的并行訪問和低延遲,該規范定義了一個協議接口,旨在與高性能fabric技術配合使用,包括通過實現RDMA技術的InfiniBand、RoCE v2、iWARP或TCP。

NVMe-oF是一種使用NVMe協議將訪問擴展到遠程存儲系統的非易失性存儲器(NVM)設備的方法。這使得前端接口能夠連接到存儲系統中,擴展到大量NVMe設備,并延長數據中心內可以訪問NVMe子系統的距離。NVMe-oF的目標是顯著改善數據中心網絡延遲,并為遠程NVMe設備提供近似于本地訪問的延遲,目標為10us。

我們知道AI對計算的需求非常大,目前主流的AI加速還是以GPU、FPGA和一些專門的AI芯片等為主。在GPU、AI芯片用于AI計算之前都是CPU承擔計算的任務,CPU的效率難以滿足需求,從而產生CPU+GPU+ASIC的異構計算。隨著DPU的出現,這種異構計算的發展更加徹底,可以更大提供并行處理能力,適合大規模計算的發展。

a217cd2e-a8df-11ed-bfe3-dac502259ad0.png

支持Chiplet技術的超異構算力芯片,伴隨著AI/ML的發展將會得到更好的應用,而支持Die-To-Die互聯技術將能夠提供互聯其他AI芯片和算力單元的巨大能力,擺脫一直以來PCIe發展的限制。 ??拿芯啟源自身舉例,以支持高級AI為主要目標之一的芯啟源最新的DPU芯片,其架構中就應用Chiplet技術。不僅提升了自有智能網卡的性能,通過支持與第三方芯片的Die-To-Die互聯,還可以集成更多的特定專業領域的芯片,比如AI訓練中的GPU芯片。

雖然PCIe非常的標準,但是帶寬非常有限的,PCIe Gen3的理論帶寬是32GB/s,PCIe Gen4的理論帶寬是64GB/s,而實測帶寬大概分別是24GB/s和48GB/s。

在AI訓練中,每完成一輪計算,都要同步更新一次參數,也就是權系數。模型規模越大,參數規模一般也會更大,這樣算力芯片的效率會收到PCIe架構的限制,支持更高能力層次的互聯技術講徹底解決帶寬限制和瓶頸,極大提升單節點計算效率。

和ChatGPT聊了那么多,最后再讓我們來看看他/她對于DPU應用了解多少呢?

a2a5aea0-a8df-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34274

    瀏覽量

    275451
  • DPU
    DPU
    +關注

    關注

    0

    文章

    390

    瀏覽量

    24707
  • chiplet
    +關注

    關注

    6

    文章

    453

    瀏覽量

    12870

原文標題:爆紅智能AI如何看待DPU ChatGPT這樣說

文章出處:【微信號:corigine,微信公眾號:芯啟源】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI智能眼鏡將達千萬級,這顆芯片提前火了!

    電子發燒友網報道(文/黃晶晶)自CES2025展上AI智能眼鏡大放異彩之后,業界普遍期待這一單品有望接棒TWS耳機,成為又一款消費電子產品。前有?Meta 公司與雷朋(Ray-Ban)品牌合作推出
    的頭像 發表于 02-24 07:48 ?3386次閱讀
    <b class='flag-5'>爆</b>品<b class='flag-5'>AI</b><b class='flag-5'>智能</b>眼鏡將達千萬級,這顆芯片提前火了!

    【解構·AI玩具】從“小智AI”引爆開發者熱潮說起

    一、AI玩具火,“小智AI”引爆全民熱潮 在眾多AI硬件產品當中,AI玩具曾長期被視為邊緣品類,相較于滿足功能性需求的
    發表于 05-20 09:20 ?1120次閱讀
    【解構·<b class='flag-5'>AI</b>玩具】從“小智<b class='flag-5'>AI</b>”引爆開發者熱潮說起

    《零基礎開發AI Agent——手把手教你用扣子做智能體》

    《零基礎開發AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發指南。它不僅深入淺出地講解了Agent的概念和發展,還通過詳細的工具介紹和實戰案例,幫助讀者快速掌握
    發表于 03-18 12:03

    10分鐘快速打造AI硬件!涂鴉產品AI功能和智能體開發平臺重磅上新

    智能化浪潮的推動下,AI智能設備的深度融合,不僅重塑了人類的生活方式,更為開發者帶來了無限想象空間。例如AI陪伴機器人、AI玩具、
    的頭像 發表于 03-06 18:59 ?650次閱讀
    10分鐘快速打造<b class='flag-5'>爆</b>款<b class='flag-5'>AI</b>硬件!涂鴉產品<b class='flag-5'>AI</b>功能和<b class='flag-5'>智能</b>體開發平臺重磅上新

    又一個中國AI產品Manus刷屏 中國AI新星Manus火 全網搶邀請碼

    Manus 的 AI 產品在科技圈一夜火,全球首款通用智能體Manus開啟內測火,據說現在很多的網友都在求Manus邀請碼。而Manus的
    的頭像 發表于 03-06 14:09 ?1273次閱讀

    AI賦能邊緣網關:開啟智能時代的新藍海

    在數字化轉型的浪潮中,AI與邊緣計算的結合正掀起一場深刻的產業變革。邊緣網關作為連接物理世界與數字世界的橋梁,在AI技術的加持下,正從簡單的數據采集傳輸節點,進化為具備智能決策能力的邊緣計算單元
    發表于 02-15 11:41

    泰晶科技晶振在AI眼鏡中的應用

    近年來,隨著人工智能與增強現實(AR)技術的深度融合,AI智能眼鏡正從科幻概念加速邁向消費級市場,成為繼智能手機之后最具潛力的下一代智能終端
    的頭像 發表于 02-14 16:18 ?610次閱讀

    HarmonyOS NEXT 應用開發練習:AI智能對話框

    一、練習內容 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發語言創建一個功能更為豐富的AI智能對話框。這個對話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號,并
    發表于 01-03 11:29

    AI智能網卡在AI網絡中的作用

    寫在開頭,本文主要介紹智能網卡在AI網絡的作用并在一定場景下說明DPU智能網卡在功能上的一些區別以理解兩者的相似點和不同點。
    的頭像 發表于 12-18 16:17 ?1194次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和
    發表于 10-14 09:21

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 關于《AI for Science:人工智能驅動科學創新》第二章“AI
    發表于 10-14 09:16

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬
    發表于 09-09 15:36

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

    DPU 是當下算力基礎設施的核心創新之一。如果把 CPU 比做大腦,那么 GPU 就好比是肌肉,而 DPU 就是神經中樞。CPU 承載了應用生態,提供了通用型算力;GPU 提供了高密度各類精度的算
    發表于 07-24 15:32

    魔9S Pro系列AI游戲手機正式發布

    在萬眾矚目中,魔電競宇宙今日迎來了激動人心的時刻——全新魔9S Pro+與魔9S Pro兩款AI游戲手機正式揭開神秘面紗,以顛覆性的姿態引領游戲手機市場邁入“游戲
    的頭像 發表于 07-04 15:15 ?1053次閱讀