女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聚焦 | 什么是AI芯片“存儲墻”的解決方案?

SSDFans ? 來源:YXQ ? 2019-06-18 15:12 ? 次閱讀

在2016年威海參加中國體系結構年會的時候,孫所也說了一句調侃的話:“現在的AI很火,大家都往那邊去,沒有人太關心體系結構了,我要告訴那些追AI熱點的,它都死了三回了!” 的確,作為從小學馬列的中國人,我們最熟悉螺旋式上升的概念。對于計算和I/O來講,和中國經濟調控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發布了TPU V1之后,現在已經有越來越多的AI startup的芯片出現,大家基本上都是用標準的Resnet50,Googlenetv3 等網絡為benchmark, 一次一次地刷新性能和功耗比,個人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務上超過人腦,現在AI在準確率和性能上都超過了。對于AI的芯片來講,有一個指標也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現在新出的AI ASIC往往在FLOP/s并不發力,因為從功耗比的角度上,算力肯定不是越高越好,而且大家都很難高過老黃的核彈。

代表了一個特定的計算平臺的peak performance,就是最大算力。

就是特定的計算平臺的I內存/O帶寬,這個和該計算平臺使用的DDR類型有關。

X軸是I,代表計算強度,就是在一個Byte上的計算量。因為對于一個特定的平臺,我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計算強度。

因此,和圖上顯示的一樣,在點(Imax,),這個計算平臺達到了完美。在它的左邊,說明memory受限,在它的右邊說明計算受限。

因此,對于我們之前分析的Alexnet這個網絡,我們就知道了它的總的計算量就是:

內存訪問量 計算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因為對于每一次訪存都是32位的Float Point,因此整個內存的占用就是 260MB左右,而計算量是724MFLOPs,因此Alexnet的計算強度就是724/260=2.7 operation/byte。

對于一個特定的平臺,比如老黃家的新的GTX2080Ti 系列來講:

對于計算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個,就可以看出,對于Alex的2.7 來講,遠遠沒有達到2080ti的計算強度,主要是受限于內存帶寬了。

在Google的TPU中,有一個圖經常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網絡可以完全用滿TPU的peak performance。

怎么辦,內存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認為目前應該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計算應該是下一個方向。

這個就引出了在Memory+會議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    52199

    瀏覽量

    436284
  • AI
    AI
    +關注

    關注

    87

    文章

    34269

    瀏覽量

    275427

原文標題:什么是AI芯片“存儲墻”的解決方案?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、
    的頭像 發表于 03-31 11:27 ?391次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動態心電圖設備存儲解決方案

    貼片式SD卡存儲解決方案,通過硬件與軟件的深度協同,全面提升了動態心電圖設備的性能。 1)大容量存儲,滿足數據需求 MKDV08GCL-STPA存儲芯片提供了8Gb的
    發表于 03-27 10:56

    華為發布AI WAN解決方案

    在MWC25巴塞羅那期間,華為數據通信產品線總裁王雷在產品與解決方案發布會上正式發布了AI WAN解決方案。他表示,運營商加速網絡與AI融合,AI
    的頭像 發表于 03-05 10:18 ?544次閱讀

    啟明智顯AI解決方案,用AI生活助手角度打開AI智能體的一天

    啟明智顯AI解決方案打造AI生活助手,用AI智能體的角度看AI解決方案能實現哪些功能
    的頭像 發表于 02-26 14:43 ?516次閱讀
    啟明智顯<b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>,用<b class='flag-5'>AI</b>生活助手角度打開<b class='flag-5'>AI</b>智能體的一天

    廣和通正式推出AI玩具大模型解決方案

    廣和通近期推出了一款創新的AI玩具大模型解決方案,該方案深度融合了豆包等AI大模型,并內置了廣和通Cat.1模組,為智能玩具的AI化升級提供
    的頭像 發表于 01-24 10:36 ?1075次閱讀

    廣和通發布AI玩具大模型解決方案

    近日,廣和通推出了一項專為AI玩具設計的創新解決方案——AI玩具大模型解決方案。該方案深度融合了豆包等領先的
    的頭像 發表于 01-21 14:45 ?1100次閱讀

    廣和通推出AI玩具大模型解決方案

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內置廣和通Cat.1模組,助力智能玩具實現AI化升級。該
    的頭像 發表于 01-21 10:27 ?675次閱讀

    黑芝麻智能與RockAI發布AI Agent解決方案

    黑芝麻智能與RockAI聯合發布基于武當C1200家族芯片AI Agent解決方案,該方案將部署于未來的智能座艙應用中。
    的頭像 發表于 01-10 16:33 ?643次閱讀

    企業AI解決方案包括哪些內容

    企業AI解決方案是一種集成了人工智能技術的綜合性方案,旨在提高企業運營效率、降低成本、優化業務流程,并提升企業的整體競爭力。那么,企業AI解決方案
    的頭像 發表于 01-10 10:15 ?393次閱讀

    聚焦AI芯片,角逐芯未來

    國產AI芯片規模壯大 在科技高速發展的今天,算力已成為驅動行業創新與變革的核心引擎。中信證券發布的最新研報,聚焦于國產AI芯片市場的蓬勃發展
    的頭像 發表于 01-08 09:10 ?503次閱讀

    中興通訊推出AI FWA全棧解決方案

    近日,在土耳其伊斯坦布爾舉辦的終端用戶大會上,作為全球領先的綜合信息與通信技術解決方案提供商中興通訊,首次聚焦固定無線接入(FWA)與移動寬帶(MBB)業務領域,并隆重推出了業界首創的AI FWA全
    的頭像 發表于 11-18 17:10 ?1219次閱讀

    emc存儲解決方案的優勢

    在當今這個數據驅動的時代,企業對于數據存儲的需求日益增長。EMC,作為全球領先的數據存儲解決方案提供商,以其創新的技術、高性能的產品和全面的服務,幫助企業實現數據的高效管理和利用。 1. 高性能和可
    的頭像 發表于 11-01 15:16 ?922次閱讀

    基于CSS融合存儲系統的自動化制造服務平臺存儲解決方案

    基于CSS融合存儲系統的自動化制造服務平臺存儲解決方案
    的頭像 發表于 09-10 10:15 ?553次閱讀
    基于CSS融合<b class='flag-5'>存儲</b>系統的自動化制造服務平臺<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    憶聯SSD存儲解決方案亮相2024中國國際金融展

    數智化時代的存儲解決方案”為主題發表演講,分享憶聯如何以高效能SSD存儲解決方案助力AI時代下的金融科技產業實現存力飛躍。
    的頭像 發表于 07-22 10:52 ?993次閱讀
    憶聯SSD<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>亮相2024中國國際金融展

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案
    的頭像 發表于 06-26 18:13 ?1180次閱讀