燧原科技于7月7日在上海發布第二代人工智能訓練產品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內首家發布第二代人工智能訓練產品組合的公司。
這是繼2019年12年發布第一代訓練芯片,邃思1.0及云燧T10/T11,2020年12月發布第一代推理產品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發布“云燧T20”訓練加速卡和“邃思2.0”芯片
燧原產品的商業落地場景包括,液冷超大規模集群,加速視頻內容生產;強化學習使能游戲AI,改變數字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數據,構建新型智能化交通;高效推理算力集群,建設園區AI視頻云。
隨著第二代產品的發布,將加速這些場景的商業化落地。
云燧智算集群
隨著自然語言處理、強化學習、無監督學習、多模態和認知模型等的發展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應用上,綠色一體化的超級智算集群是關鍵趨勢。
燧原發布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認為是在數據中心最先進的數據模式。
此外,DTU2.0植入完全可編程的數據流,軟件指令驅動的傳輸和數據計算,標量、向量和張量的高效數據處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。

6個LARE卡間互聯端口,每一個端口雙向50GB/s,總集群互聯帶寬300GB/s。
云燧T21\T20訓練產品,分別為OAM標準模組和全高全長PCIE板卡。

以Benchmark數據來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標檢測、圖像分割、推薦等均有明顯優勢。

馭算Topsrider2.0架構
馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。

云端訓練計算產品路線圖
訓練產品方面,燧原計劃第三代T30/T31產品將于2023年發布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發布i20推理芯片,以及2023年將發布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎上,還將進一步升級至Topsrider3.x,致力于泛AI生態。
生態建設
AI生態也是跨行業的、復雜的生態競爭。燧原推出的異構計算生態燎原計劃,將聚集生態的三大特征:原始創新、標準化和生態共建。
燎原計劃將建立繁榮開放的開發者生態,健康互利的產業生態,持續創新的科研生態。打造以人工智能為起點構建通用異構計算生態,構建標準化的技術體系,共建完整生態服務數字中國。將涵蓋深度學習計算,通用異構計算以及視覺計算。

趙立東表示,未來行業的發展趨勢表明,以芯片為核心的算力,是工業4.0兵家必爭之地。工業4.0時代,人工智能是關鍵動力。摩爾定律放緩,異構計算加速,基于小芯片、封裝技術,人工智能落地將改變互聯網重塑傳統行業。算力需示爆炸,算力成為人工智能技術發展的基礎。燧原科技要建立世界水平的本土化研發和工程化團隊,開發國產自主創新的核心技術,布局云端AI+高端芯片雙賽道。我們為數據中心打造最優的云端AI產品,形成訓練推理完整的閉環解決方案。
本文由電子發燒友原創,作者黃晶晶,微信號kittyhjj,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿發郵件到huangjingjing@elecfans.com。
這是繼2019年12年發布第一代訓練芯片,邃思1.0及云燧T10/T11,2020年12月發布第一代推理產品云燧i10之后,燧原科技的又一力作。

燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發布“云燧T20”訓練加速卡和“邃思2.0”芯片
燧原產品的商業落地場景包括,液冷超大規模集群,加速視頻內容生產;強化學習使能游戲AI,改變數字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數據,構建新型智能化交通;高效推理算力集群,建設園區AI視頻云。
隨著第二代產品的發布,將加速這些場景的商業化落地。
云燧智算集群
隨著自然語言處理、強化學習、無監督學習、多模態和認知模型等的發展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應用上,綠色一體化的超級智算集群是關鍵趨勢。
燧原發布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構成先進封裝。封裝尺寸為57.5mm*57.5mm。

燧原科技第二代通用人工智能訓練芯片“邃思2.0”
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認為是在數據中心最先進的數據模式。
此外,DTU2.0植入完全可編程的數據流,軟件指令驅動的傳輸和數據計算,標量、向量和張量的高效數據處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。

6個LARE卡間互聯端口,每一個端口雙向50GB/s,總集群互聯帶寬300GB/s。
云燧T21\T20訓練產品,分別為OAM標準模組和全高全長PCIE板卡。

以Benchmark數據來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標檢測、圖像分割、推薦等均有明顯優勢。

馭算Topsrider2.0架構
馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。

云端訓練計算產品路線圖
訓練產品方面,燧原計劃第三代T30/T31產品將于2023年發布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發布i20推理芯片,以及2023年將發布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎上,還將進一步升級至Topsrider3.x,致力于泛AI生態。
生態建設
AI生態也是跨行業的、復雜的生態競爭。燧原推出的異構計算生態燎原計劃,將聚集生態的三大特征:原始創新、標準化和生態共建。
燎原計劃將建立繁榮開放的開發者生態,健康互利的產業生態,持續創新的科研生態。打造以人工智能為起點構建通用異構計算生態,構建標準化的技術體系,共建完整生態服務數字中國。將涵蓋深度學習計算,通用異構計算以及視覺計算。

趙立東表示,未來行業的發展趨勢表明,以芯片為核心的算力,是工業4.0兵家必爭之地。工業4.0時代,人工智能是關鍵動力。摩爾定律放緩,異構計算加速,基于小芯片、封裝技術,人工智能落地將改變互聯網重塑傳統行業。算力需示爆炸,算力成為人工智能技術發展的基礎。燧原科技要建立世界水平的本土化研發和工程化團隊,開發國產自主創新的核心技術,布局云端AI+高端芯片雙賽道。我們為數據中心打造最優的云端AI產品,形成訓練推理完整的閉環解決方案。
本文由電子發燒友原創,作者黃晶晶,微信號kittyhjj,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿發郵件到huangjingjing@elecfans.com。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
87文章
33998瀏覽量
275002 -
燧原科技
+關注
關注
0文章
136瀏覽量
8810
發布評論請先 登錄
相關推薦
熱點推薦
《中國汽車芯片聯盟白名單》2.0版本發布,覆蓋300多家廠商的超1800款產品
電子發燒友網報道(文/吳子鵬)日前,為了及時向行業提供更加準確有效的產品信息,更好地推動國產汽車芯片得到廣泛應用,中國汽車芯片產業創新戰略聯盟在其官方微信公眾號正式發布了《

清華光芯片取得新突破,邁向AI光訓練
電子發燒友網報道(文/吳子鵬)近日,清華大學發布官方消息稱,清華大學電子工程系方璐教授課題組、自動化系戴瓊海院士課題組另辟蹊徑,首創了全前向智能光計算訓練架構,研制了“太極-II”光訓練
海思SD3403邊緣計算AI數據訓練概述
AI數據訓練:基于用戶特定應用場景,用戶采集照片或視頻,通過AI數據訓練工程師**(用戶公司****員工)** ,進行特征標定后,將標定好的訓練
發表于 04-28 11:11
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
RZ/V2N——近期在嵌入式世界2025上新發布,為 AI 計算、嵌入式系統及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發者和企業用戶對高性能、低功耗和靈活擴展的需求。
[](
發表于 03-19 17:54
燧原科技亮相2024中國人工智能大會
近日,燧原科技創新研究院首席研究員石恒博士受邀在2024中國人工智能大會的“AI芯片與智能計算創新生態”專題論壇上,發表了《面向
亞馬遜轉向Trainium芯片,全力投入AI模型訓練
,亞馬遜AWS推出了兩款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于AI模型的訓練。 然而,隨著生成式
Untether發布人工智能(AI)芯片
初創企業Untether發布了一款專為汽車、農業裝備及極端環境AI應用設計的人工智能(AI)芯片。
相較于英偉達和AMD的旗艦AI
AI算力芯片供電電源測試利器:費思低壓大電流系列電子負載
AI算力芯片作為驅動復雜計算任務的核心引擎,其性能與穩定性成為了決定應用成敗的關鍵因素。而在這背后,供電電源的穩定性和高效性則是保障AI算力芯片

燧原科技啟動IPO輔導,加速AI算力底座布局
近日,中國證監會正式披露了上海燧原科技股份有限公司(簡稱:燧原科技)的IPO輔導備案報告,標志著這家AI芯片領域的獨角獸企業正式踏上了上市征
中國Wi-Fi7 FEM F4誕生
。在2024年年初,三伍微推出了Wi-Fi7 FEM,性能不輸國際廠商。腳步不能停留,Wi-Fi8已經在路上。有未來的路,是幸福的路。
至此,中國Wi-Fi7 FEM的F4正式誕生,可以量產供應
發表于 07-31 11:14
蘋果承認使用谷歌芯片來訓練AI
蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端AI
AI初出企業Cerebras已申請IPO!稱發布的AI芯片比GPU更適合大模型訓練
美國加州,專注于研發比GPU更適用于訓練AI模型的晶圓級芯片,為復雜的AI應用構建計算機系統,并與阿布扎比科技集團G42等機構合作構建超級


評論