女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

清華「計圖」現在支持國產芯片了!

旺材芯片 ? 來源:凹非寺量子位 ? 作者:明敏 ? 2021-05-20 09:43 ? 次閱讀

清華自研的深度學習框架計圖(Jittor)在動態圖推理速度上又一次完勝PyTorch。

最近,計圖團隊完成了在寒武紀芯片MLU270上的移植。

這一次跟寒武紀的合作,使Jittor在backbone網絡模型中的動態圖推理速度較PyTorch平均提升了276.69倍。

從團隊公布的實驗結果可以看到,在寒武紀芯片上分別用計圖(Jittor)和PyTorch進行推理。

計圖(Jittor)在16種backbone網絡模型中的推理速度都較PyTorch大幅提升,其中包括alexnet、vgg系列、resnet系列。

其中最快的是alexnet,提升速度達到了464.43倍,最慢的resnet50也達到了153倍。

平均提升速度達276.69倍。

660375ea-b47b-11eb-bf61-12bb97331649.jpg

6611aa8e-b47b-11eb-bf61-12bb97331649.jpg

△表1:模型具體數值

與此同時,計圖的精度損失也較PyTorch大幅減少。

66332ff6-b47b-11eb-bf61-12bb97331649.jpg

△表2:resnet18的mse誤差對比

團隊以resnet18網絡為例進行對比,baseline是CPU;結果顯示:計圖的精度損失比PyTorch降低了42.53%。

還是「元算子」的功勞

性能得到如此大的提升,是怎么實現的呢?

要知道,在TensorFlow,PyTorch框架底層,有上千個算子;想要移植新的硬件,就必須將大量的算子復寫,這樣一來不僅工作量劇增、而且難度也會加大。

Jittor這次還是依靠他們的核心武器——元算子。

根據Jittor官方文檔定義,元算子是指神經網絡所需的基本算子。

早在設計Jittor的時候,研發團隊就定下了一個目標,即用戶只需要數行代碼,就可定義新的算子和模型。在保證易用的同時,不喪失任何可定制性。

所以在Jittor中,多個元算子之間,可以相互融合成更加復雜的算子,這些復雜算子構成了神經網絡計算的多個模塊,如卷積層,歸一化層等等。

664c0422-b47b-11eb-bf61-12bb97331649.jpg

△使用元算子實現卷積層

這一次將Jittor移植到寒武紀上,也是同樣的原理。

研究團隊把神經網絡所需的基本算子,定義為三類共18個元算子。

讓元算子相互融合形成常用算子,這樣就能通過優化非常少的元算子,實現對常用算子性能的提升。

66677d4c-b47b-11eb-bf61-12bb97331649.jpg

并且,元算子還是反向傳播閉包,所有元算子反向傳播后依舊是元算子。

所以在完成三類元算子的移植后,Jittor天然就能支持大部分常用算子的推理和簡單訓練。

從Jittor元算子到BANG

為了能讓用戶更為簡單地操作,Jittor內置了元算子編譯器,可以將用戶的Python代碼動態編譯成寒武紀BANG語言。

BANG語言是專門針對寒武紀產品架構的一種代碼語言,它能極大優化寒武紀芯片的通用編程能力,提升用戶編程的自由度。

并且它還有全套編譯工具鏈來提高性能。包括CNCC(Cambricon Neuware Compiler Collection )、CNAS(Cambricon Neuware Assembler)、CNLINKER(Cambricon Neuware Linker)。

Jittor內置的元算子編譯器可以把元算子自動轉化為BANG算子。

采用動態編譯的方式,能在運行時獲取更多的信息,比如計算圖上下文、形狀信息等,這些信息都可以進一步提升算子的性能。

并且,Jittor還內置了可以根據硬件設備自動對BANG語言進行優化的優化編譯遍(complier pass),從而生成對硬件設備更為適合的底層算子。

用這種方法,僅僅一行Python代碼,就能表示BatchNorm算子的核心思想。

元算子編譯器再把這行代碼自動優化成BANG語言代碼。

由于BANG語言的設計更加成熟,提供了類似于CUDA語言的線程調度模式,使得上手和調試都更加簡單;也能更好地釋放寒武紀芯片的算力。

6678e168-b47b-11eb-bf61-12bb97331649.jpg

清華自研,首個中國高校深度學習開源框架

計圖(Jittor)的開發團隊,均來自清華大學計算機系圖形學實驗室,負責人是清華大學計算機系的胡事民教授。

而主要負責開發的,則是來自實驗室的博士生們:梁盾、楊國燁、楊國煒、周文洋……

計圖(Jittor)與主流的深度學習框架TensorFlow、Pytorch等最大的不同在于,它是一個完全基于動態編譯(Just-in-time)、使用元算子和統一計算圖的深度學習框架。

它可以不像Pytorch那樣依賴tracing機制,讓用戶的操作更加簡單,同時還可以得到更好的學習訓練效果。

對于這一次取得的成果,開發者之一梁盾透露未來有可能發表在頂會上,并且會開源給大家。

此前,計圖開源的點云模型庫,在多種主流模型上訓練性能較Pytorch提升一倍以上;并發布了第一個支持金屬度、粗糙度的可微渲染庫。

最近,他們還開源了一個智能P圖神器DeepFaceEditing,可以通過草圖自由編輯人臉。

感興趣的同學可以去試試哦~

GitHub開源:

https://github.com/IGLICT/DeepFaceEditing-Jittor

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11053

    瀏覽量

    216255
  • 神經網絡
    +關注

    關注

    42

    文章

    4811

    瀏覽量

    103016
  • 寒武紀
    +關注

    關注

    11

    文章

    199

    瀏覽量

    74259
  • pytorch
    +關注

    關注

    2

    文章

    809

    瀏覽量

    13806

原文標題:關注 | 清華「計圖」現在支持國產芯片了!動態圖推理比PyTorch快了270倍

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    清華芯片取得新突破,邁向AI光訓練

    電子發燒友網報道(文/吳子鵬)近日,清華大學發布官方消息稱,清華大學電子工程系方璐教授課題組、自動化系戴瓊海院士課題組另辟蹊徑,首創全前向智能光計算訓練架構,研制“太極-II”光訓
    的頭像 發表于 08-13 01:23 ?3676次閱讀

    #電路知識 #芯片 #國產芯片

    國產芯片行業資訊
    芯佰微電子
    發布于 :2025年04月29日 10:19:29

    國產SL4013芯片如何實現USB 5V升壓至24V以上?

    可靠且易用的解決方案。隨著國產芯片技術的持續突破,SL4013將在工業自動化、智能硬件等領域展現更大價值。 提供樣品 技術支持 原理
    發表于 04-28 17:39

    國產升壓芯片如何單節鋰電3.7V升壓24V或4.2V升壓24V

    芯片的突破性進展為行業提供更優解。?SL4013?作為國產高性價比升壓芯片的代表,憑借其?寬輸入范圍、高效率、高集成度?等特點,成為鋰電池升壓場景的熱門選擇。 二、SL4013
    發表于 04-23 11:11

    國產沁恒微芯片怎么樣?

    支持USB4 Gen4協議,已應用于雷電4數據線設計?4。 ?四、綜合競爭力評價? 沁恒微芯片憑借?接口技術深度整合?、?協議標準前瞻支持?(如PD3.1、USB4)及?高性價比國產
    發表于 03-20 10:51

    支持國貨!?。∶夥e分分享國產芯片電機驅動系統設計

    美國對中國的芯片出口進行嚴格管制,導致中國很多科技企業陷入困難境地,發展和使用國產化的芯片刻不容緩,在此背景下,本文設計一款全國產化的電機
    發表于 03-07 13:36

    午芯芯科技國產電容式MEMS壓力傳感器芯片突破卡脖子技術

    從設計到生產,包括原材料,全部國產化,無任何外資,不受國外技術或價格影響,供應穩定。3.后續會推出加速度、陀螺儀、硅麥等產品午芯芯科技WXP380 是電容式 MEMS 壓力傳感器芯片,具有低功耗、低
    發表于 02-19 12:19

    芯片在CP測試后都經歷啥?#芯片 #電路知識 #國產芯片 #國產

    芯片
    芯佰微電子
    發布于 :2025年02月17日 11:02:40

    國產芯片有能替代DAC8555芯片的嘛?

    國產芯片有能替代DAC8555芯片的嘛?
    發表于 11-22 15:37

    基于國產芯片的IPMI解決方案

    基于國產芯片的IPMI解決方案有重要升級?。?2024年,北京啟揚日升科技有限公司對IPMI解決方案做了兩個方面的重大升級,一是擴展國產
    的頭像 發表于 11-11 18:29 ?925次閱讀
    基于<b class='flag-5'>國產</b><b class='flag-5'>芯片</b>的IPMI解決方案

    【「ARM MCU嵌入式開發 | 基于國產GD32F10x芯片」閱讀體驗】+書籍整體概況

    一、導言 上周收到《ARM MCU嵌入式開發 | 基于國產GD32F10x芯片》書籍,該紙質書籍內容可謂是面面俱到,由“清華大學出版社”出版,印刷第1版時間為2024年6月份,總共464千字
    發表于 08-25 22:48

    國產芯片

    有任何國產芯片替代的問題都可以找我,歡迎咨詢,或者需要國產芯片相關資料的都可以提供。
    發表于 07-25 16:34

    目前國產fpga的發展有哪些趨勢

    如今國產fpga也是如火如荼,請問現在國產fpga芯片的發展有哪些趨勢呢?
    發表于 06-30 08:14