女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

不只是GPU,內存廠商們的AI野望

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-09-01 00:18 ? 次閱讀

電子發燒友網報道(文/周凱揚)在諸多云服務廠商或互聯網廠商一頭扎進GPU的瘋搶潮后,不少公司也發現了限制AI大模型性能或是成本消耗的除了GPU以外,還有內存。內存墻作為橫亙在AI計算和HPC更進一步的阻礙之一,在計算量井噴的今天,已經變得愈發難以忽視。所以,在今年的HotChips大會上,內存廠商們也競相展示自己的內存技術在AI計算上的優勢。

三星

三星作為最早一批開始跟進存內計算的公司,早在兩年前的HotChips33上,就展示了HBM2-PIM的技術Aquabolt-XL。三星在去年底展示了用PIM內存和96個AMD Instinct MI100 GPU組建的大規模計算系統,并宣稱這一配置將AI訓練的速度提高了近2.5倍。

而今年的HotChips上,三星也著重點明了PIM和PNM技術在生成式AI這類熱門應用上的優勢。三星認為在ChatGPT、GPT-3之類的應用中,主要瓶頸出現在生成階段的線性層上,這是因為GPU受到了內存限制且整個過程是線性順序進行的。

在三星對GPT的分析中,其主要由概括和生成兩大負載組成,其中概括考驗的是計算單元的性能,而生成則考驗的是內存的性能。而生成占據了絕大多數的運算次數和耗時,其中占據了60%到80%延遲的GEMV(矩陣向量操作)也就成了三星試圖用PIM和PNM攻克的目標。

根據三星的說法,像GPT這類Transformer架構的模型,都可以將多頭注意力(MHA)和前饋神經網絡(FFN)完全交給PIM或PNM,完全利用他們的所有帶寬,從而減少在推理上所花費的時間和能耗。三星也在單個AMD MI100-PIM的GPU上進行了試驗,得出運行GPT模型時,在HBM-PIM的輔助下,能效是GPU搭配傳統HBM的兩倍,性能同樣提升至兩倍以上。

wKgZomTwaRqAN2Y0AAEQ1l7kLeE723.jpg
LPDDR-PIM概念 / 三星

除了HBM-PIM外,這次三星還展示了最新的LPPDR-PIM概念。除了云端生成式AI需要存內計算的輔助外,諸如智能手機這樣的端側生成式AI概念也被炒起來,所以LPPDR-PIM這樣的存內計算技術,可以進一步保證續航的同時,也不會出現為了帶寬內存使用超量的情況。

SK海力士

另一大韓國內存巨頭SK海力士也沒有閑著,在本次HotChips大會上,他們展示了自己的AiM存內加速器方案。相較三星而言,他們為生成式AI的推理負載準備的是基于GDDR6的存內計算方案。

GDDR6-AiM采用了1y的制造工藝,具備512GB/s內部帶寬的同時,也具備32GB/s的外部帶寬。且GDDR6-AiM具備頻率高達1GHz的處理單元,算力可達512GFLOPS。GDDR6-AiM的出現,為存內進行GEMV計算提供了端到端的加速方案,比如乘法累加和激活函數等操作都可以在內存bank內同時進行,單條指令實現全bank操作提供更高的計算效率。

同時,SK海力士也已經考慮到了AiM的擴展性問題,比如單個AiM卡中集成了8個AiM封裝,也就是8GB的容量和256個處理單元。但這類擴展方案最大的問題還是在軟件映射、硬件架構和接口上,這也是絕大多數集成存內計算的新式內存面臨的問題。

wKgaomTwaSaAfbrEAAGKrRvOuwQ093.jpg
AiM系統擴展性驗證Demo / SK海力士


而SK海力士已經給出了這方面的解決方案,比如專門針對AiM的Tiling、基于AiM架構的控制器、路由和ALU等等。他們還展示了在兩個FPGA上結合GDDR6-AiM的Demo,以及用于LLM推理的軟件棧。與此同時,他們也還在探索AiM的下一代設計,比如如何實現更高的內存容量,用于應對更加龐大的模型。

寫在最后

無論是三星還是SK海力士都已經在存內計算領域耕耘多年,此次AI熱來勢洶洶,也令他們研發速度進一步提快。畢竟如今能夠解決大模型訓練與推理的耗時與TCO的硬件持續大賣,如果存內計算產品商業化量產落地進展順利,且確實能為AI計算帶來助力的話,很可能會小幅提振如今略微萎縮的內存市場。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4910

    瀏覽量

    130653
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    CPU\GPU引領,國產AI PC進階

    電子發燒友網報道(文/黃晶晶)當前AI PC已經成為PC產業的下一個浪潮,國產CPU、GPU廠商在PC市場一直處于追趕態勢,AI PC給了大家新的機遇,在這個賽道國產
    的頭像 發表于 09-01 02:15 ?5555次閱讀
    CPU\<b class='flag-5'>GPU</b>引領,國產<b class='flag-5'>AI</b> PC進階

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    正點原子 AI BOX0攜小智AI來襲,專屬你的智能伴侶!你的全能AI伙伴,懂你更貼心 正點原子ESP32 AI BOX0 — 不只是桌面擺
    發表于 04-24 16:11

    安全地毯不只是地毯,它是你的第二道保險

    保護裝置
    jf_18500570
    發布于 :2025年02月15日 10:42:13

    AI“神助攻”!又一家國產GPU廠商啟動IPO,數量增至5家

    電子發燒友網綜合報道,前段時間已有三家GPU廠商相繼辦理備案登記,啟動A股IPO進程,包括壁仞科技、摩爾線程、沐曦,還有AI算力芯片廠商燧原科技。如今又有一家
    發表于 02-12 01:21 ?922次閱讀
    <b class='flag-5'>AI</b>“神助攻”!又一家國產<b class='flag-5'>GPU</b><b class='flag-5'>廠商</b>啟動IPO,數量增至5家

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發表于 01-06 10:45 ?527次閱讀

    GPU是如何訓練AI大模型的

    AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練
    的頭像 發表于 12-19 17:54 ?627次閱讀

    PON不只是破網那么簡單

    大家有沒有在網絡卡頓的時候,心里默默吐槽“這破網”?今天要聊的PON(Passive Optical Network,無源光網絡),可不是你心里那個“破”網,而是網絡世界中的超級英雄家族——PON。 ? 別急,我知道你在想什么,這聽起來可能有點枯燥,但相信我,這絕對比你想象的要有趣得多! 1 PON,網絡界的“超級英雄” PON,是指利用點對多點拓撲和分光器將數據從單個傳輸點傳送到多個用戶端點的光纖網絡,由OLT(Optical Line Terminal,光線路終端),ONU(Optical Net
    的頭像 發表于 12-04 09:08 ?728次閱讀
    PON<b class='flag-5'>不只是</b>破網那么簡單

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優化的思考。 GPU的存儲體系采用了獨特的倒金字塔結構,在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統馮諾依曼架構的內存瓶頸,合并訪存機制巧妙解決了內存帶寬限制。NVIDIA
    發表于 11-24 17:12

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具。
    的頭像 發表于 10-24 09:39 ?866次閱讀

    科技云報到:大模型時代下,向量數據庫的野望

    科技云報到:大模型時代下,向量數據庫的野望
    的頭像 發表于 10-14 17:18 ?482次閱讀

    三星電子HBM3E內存獲英偉達認證,加速AI GPU市場布局

    為英偉達H200系列AI GPU的首選內存解決方案,同時,針對英偉達Blackwell系列的驗證工作也在緊鑼密鼓地進行中,預示著雙方合作的進一步深化。
    的頭像 發表于 09-05 17:15 ?958次閱讀

    精密空調——結構和功能揭秘!精密空調不只是調節溫度#精密空調

    精密空調
    北京匯智天源
    發布于 :2024年08月30日 19:15:07

    精密空調—不只是溫度和濕度,精密空調的空氣過濾也很硬核#精密空調

    精密空調
    北京匯智天源
    發布于 :2024年08月12日 19:35:31

    不只是前端,后端、產品和測試也需要了解的瀏覽器知識(二)

    繼上篇《 不只是前端,后端、產品和測試也需要了解的瀏覽器知識(一)》介紹了瀏覽器的基本情況、發展歷史以及市場占有率。 本篇文章將介紹瀏覽器基本原理。 在掌握基本原理后,通過技術深入,在研發
    的頭像 發表于 08-12 14:32 ?604次閱讀
    <b class='flag-5'>不只是</b>前端,后端、產品和測試也需要了解的瀏覽器知識(二)

    AI戰略構建與商業落地:Andreas Weigend大師課在上海圓滿落幕!

    的專業人士深入探討了人工智能(AI)的前沿科技和商業應用。 Weigend博士在交流會上指出,社交數據革命與AI的結合正在重塑我們的數字化生活,他強調了數據作為AI基礎的重要性,并提出了數據安全和隱私保護的緊迫性。他提到:“數據
    的頭像 發表于 07-18 11:18 ?1743次閱讀
    <b class='flag-5'>AI</b>戰略構建與商業落地:Andreas Weigend大師課在上海圓滿落幕!