女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度自研AI芯片昆侖解讀 與國產處理器飛騰良好適配

工程師鄧生 ? 來源:雷鋒網 ? 作者:包永剛 ? 2020-04-03 08:56 ? 次閱讀

4月2日下午,百度智能芯片總經理歐陽劍在一場公開課中首次對昆侖芯片進行了詳細分享,并公開了昆侖K200與英特爾T4 GPU的多項對比數據,其中最有優勢的一項數據是Gemm-Int8 的Benchmark是T4性能的3倍。歐陽劍還通過視頻展示了昆侖芯片的殺手锏,與國產處理器飛騰的良好適配。

2018年的百度AI開發者大會上,百度創始人、董事長兼CEO李彥宏宣布推出自研AI芯片昆侖。百度研發AI芯片的積累得益于其用FPGA做AI加速的積累,也得益于其在軟件定義加速器和XPU架構的多年積累。

百度最早在2010年開始用FPGA做AI架構的研發,2011年開展小規模部署上線,2017年部署超過了10000片FPGA,2018年發布自主研發AI芯片,2019年下半年流片成功,2020年開始量產。

昆侖芯片的定位是通用AI芯片,目標是提供高性能、低成本、高靈活性的AI芯片。歐陽劍在分享中說:“相比GPU,昆侖芯片的通用性和可編程性都做的不錯,并且我們還在努力把編程性做的更好。”

昆侖發布之后,其相關消息陸續公布。架構方面,昆侖有2個計算單元,512GB/S的內存帶寬,16MB SRAM/unit。歐陽劍介紹,16MB的SRAM對AI推理很有幫助,XPU架構上的XPU-SDNN是為Tensor等而設計,XPU-Cluster則能夠滿足通用處理的需求。

昆侖第一代芯片并沒有采用NVLink,而是通過PCIE 4.0接口進行互聯。在三星14nm的制造工藝和2.5D封裝的支持下,昆侖芯片峰值性能可以達到260TOPS,功耗為150W。

在靈活性和易用性方面,昆侖面向開發者提供類似英偉達CUDA的軟件棧,可以通過C/C++語言進行編程,降低開發者的開發難度。

目前,基于第一代昆侖芯片,百度推出了兩款AI加速卡,K100和K200,前者算力和功耗都是后者的兩倍。

在今天的分享中,歐陽劍給出了一系列K200對比英偉達T4的數據,其中在Gemm-Int8數據類型,4K X 4K的矩陣下,昆侖K200的Benchmark分出超過2000,是英偉達T4的3倍多。

在語音常用的Bert/Ernie測試模型下,昆侖也有明顯性能優勢。

在線上性能數據的表現上,昆侖的表現相比英偉達T4更加穩定,且延遲也有優勢。

在圖像分割YOLOV3算法中,昆侖雖然有優勢,但優勢已經不那么明顯。不過歐陽劍表示百度仍然在通過持續的優化提高昆侖的性能。

他同時表示,昆侖已經在百度內部規模應用。至于對外提供AI算力,去年12月13日百度通過定向邀請的方式通過百度云提供昆侖的算力。在與歐陽劍的直播互動中,雷鋒網(公眾號:雷鋒網)了解到通過百度云提供昆侖AI算力目前仍然是定向邀請的方式,且主要是私有部署的方式。百度會通過定向邀請的客戶的反饋消息,再通過百度云大規模向外提供昆侖的算力,但他沒有給出具體的時間線。

除了通過百度云提供昆侖的算力,歐陽劍也展示了昆侖加速卡在工業智能設備中的應用。歐陽劍演示的是用CPU和昆侖加速卡去進行產品缺陷檢測,昆侖可以大幅提升速度,但并沒有給出具體的對比數據。

另外一個展示則是昆侖的殺手锏,那就是和國產處理器平臺飛騰的適配。在2019飛騰生態伙伴大會上,歐陽劍就透露昆侖AI芯片正在適配國產飛騰服務器,做性能調優工作。在今天的線上分享中,歐陽劍展示了采用昆侖加速卡帶來的圖像分割速度的顯著加速。

飛騰CPU處理器采用的是Armv8指令級,主要用在數據中心云計算中心,作為國產芯的代表,昆侖選擇與飛騰進行很好地適配顯然是看中了國產自研芯片的大市場。

通過飛騰CPU+昆侖AI加速器的方式,雙方可以更好的實現國產芯片在服務器市場的國產化,也可以視為昆侖AI芯片和加速卡未來增長的一個重要動力和殺手锏。

責任編輯:wv

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19799

    瀏覽量

    233496
  • 百度
    +關注

    關注

    9

    文章

    2325

    瀏覽量

    91804
  • AI芯片
    +關注

    關注

    17

    文章

    1968

    瀏覽量

    35689
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    百度地圖重磅發布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發者深度開放四大核心能力和五大場景解決方案。
    的頭像 發表于 05-26 11:26 ?364次閱讀

    百度發布文心4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發者大會在武漢舉辦。百度創始人李彥宏發布了文心大模型4.5 Turbo及深度思考模型X1 Turbo兩大模型,以及多款AI應用。王海峰現場詳細
    的頭像 發表于 04-30 10:16 ?358次閱讀

    百度AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度AI領域的新進展。
    的頭像 發表于 04-30 10:14 ?364次閱讀

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得一金一銀兩項大獎。
    的頭像 發表于 04-08 15:43 ?300次閱讀

    ?強勁“中國芯”飛騰FT-2000+處理器 國產麒麟系統下的自主可控新選擇

    近年來,隨著信息技術的飛速發展,信息安全問題日益凸顯,實現核心技術的自主可控成為國家戰略。在此背景下,國產飛騰FT-2000+處理器、集特GME-2002主板與麒麟操作系統的組合,為構建
    的頭像 發表于 02-18 16:00 ?1522次閱讀
    ?強勁“中國芯”<b class='flag-5'>飛騰</b>FT-2000+<b class='flag-5'>處理器</b>  <b class='flag-5'>國產</b>麒麟系統下的自主可控新選擇

    百度智能云發布昆侖芯三代萬卡集群及DeepSeek-R1/V3上線

    01百度智能云點亮昆侖芯三代萬卡集群 近日,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的
    的頭像 發表于 02-11 10:58 ?553次閱讀

    百度成功點亮國內首個昆侖芯三代萬卡集群

    近日,百度智能云宣布了一項重大技術突破:成功點亮了國內首個昆侖芯三代萬卡集群。這一里程碑式的成就標志著百度
    的頭像 發表于 02-06 17:52 ?987次閱讀

    百度智能云點亮昆侖芯三代萬卡集群

    的人工智能算力需求。 昆侖芯三代作為百度AI芯片,其性能卓越,能夠滿足復雜的人工智能任務需
    的頭像 發表于 02-05 14:58 ?532次閱讀

    百度文庫AI功能用戶量飆升,“自由畫布”公測啟動

    近日,在備受矚目的百度AI DAY活動上,百度副總裁、文庫事業部及網盤事業部負責人王穎帶來了令人振奮的消息。她透露,百度文庫的AI功能月度活
    的頭像 發表于 01-23 10:36 ?443次閱讀

    百度文庫AI功能MAU突破9000萬

    百度文庫AI功能MAU突破9000萬,AI DAU年同比增長230%。
    的頭像 發表于 01-22 10:28 ?583次閱讀

    百度文庫AI用戶量飆升,付費用戶突破4000萬

    百度文庫在AI領域的強大吸引力和市場地位。 文庫進行重構以來,百度不斷推陳出新,為用戶帶來了智能PPT、智能文檔、研究報告、AI全網搜、
    的頭像 發表于 01-07 10:31 ?563次閱讀

    百度將發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗。
    的頭像 發表于 11-11 14:50 ?838次閱讀

    百度AI計算平臺4.0震撼發布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了AI異構計算平臺的全新力作——4.0版本。此次升級,標志著百度
    的頭像 發表于 09-26 14:46 ?768次閱讀

    國產DSP,指令集內核C2000,F28335、F280049、F28377

    國產DSP,指令集內核架構,工具鏈,完美替代TI的 C2000系列產品,F280049、F28335、F28377 性能、主頻、外設
    發表于 09-26 13:56