2021年一月,上海天數智芯半導體有限公司(以下簡稱:天數智芯)宣布,公司旗艦7nm工藝GPGPU云端訓練芯片BI成功點亮,這是國內第一款全自研、真正基于GPU架構下的7nm工藝GPGPU訓練芯片。
緊接著,2021年3月31日,天數智芯正式對外發布全自研高性能云端7nm芯片BI及產品卡,實現國產云端高性能GPGPU芯片從0到1的突破。在算力方面,天數智芯BI產品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數智芯在BI產品“點亮”時提到,BI產品的理論峰值性能達市場主流產品的2倍。一時間,國產GPGPU似乎已經站在世界之巔。但天數智芯產品副總裁鄒翾在接受電子發燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內的軟件生態是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現有軟件生態上充分發揮芯片的計算力,提供優秀的實測性能,這是國產GPGPU 發展的關鍵。”

天數智芯產品副總裁鄒翾
他還說到,國內企業一定要敢于承認這種差距,在解決這些問題以后,國內的運算平臺才會有真正的用武之地。我們企業還是要圍繞怎么解決用戶需求去發展,在這個過程中不斷追趕并縮小這種差距。。
在天數智芯的系統軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調API兼容業界主流生態以及無痛遷移。“提供高效率的軟件結構,最大限度降低已有客戶的開發遷移成本,極大地影響著整個產業的發展。” 鄒翾指出,“天數智芯在產品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發成本。我們考慮到GPGPU產品架構的通用兼容性,本著以客戶需求為出發點的原則,從實際角度為客戶實現跨平臺轉換的無痛遷移。”
鄒翾介紹說,BI產品是國內第一款全自研、真正基于通用GPU架構的GPGPU云端高端訓練芯片,以比同類產品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能。總結而言,BI產品有以下幾個優勢:
a) 全自研IP核心;
b) GPGPU架構,更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態兼容,客戶的跨平臺開發成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務。”
在采訪的過程中,我們談到了端側AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經被驗證的芯片架構。AI端側發展會驅動應用背后更多新型函數和新型算子的出現,這些需求將被融合到GPU未來的軟硬件開發中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結:
GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構間的產品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業的標桿,不僅擁有百萬開發者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優勢,再考慮到產業生態,國產GPGPU替代還有很長的路要走。在NVIDIA官網有提到,AI應用不僅需要大的內存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數據按照同樣的處理流程進行高效并行處理,CPU的優勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現的,而且以前也存在這種整合性的產品,但是對于高端的、云端的CPU加上GPU同時實現,需要非常大的尺寸規模,而且會限制芯片在各自領域的性價比。
毫無疑問,云端訓練在未來很長一段時間內仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續發展與應用落地,端側及邊緣側未來對算力性能的要求會越來越大。其中,數據中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數智芯的產品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數智芯始終以市場需求為導向,結合公司技術優勢,關注客戶需求痛點并推出適合的GPGPU產品。隨著城市數字化轉型,傳統行業智能化轉型升級需求逐漸擴大,5G、大數據中心、人工智能、工業物聯網、無人駕駛、智慧城市等眾多智能應用領域對高端GPGPU芯片產品的需求量都在急劇增加。”
2021年3月1日,天數智芯對外宣布完成12億元人民幣的C輪融資。在企業高速發展的過程中,除了資金要到位,人才是重中之重。“天數智芯目前已經擁有了一支全球頂尖的數字集成電路設計與基礎軟件設計科學家團隊,為實現公司‘做算力引擎,創世界一流’的愿景而砥礪前行。這支完整的GPGPU研發團隊,由公司聯合創始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總人數85%以上,這其中既有一批行業經驗超過20年的世界級技術專家,也有一大批擁有5-15年業界經驗的高執行力技術菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業務發展,我們將會持續不斷地吸納優秀人才深耕國產GPGPU芯片設計。隨著新產品的推出,團隊也將進一步擴大。另外,根據我們產品規劃和市場發展需要,天數智芯也會進一步通過融資支持公司的長遠發展。”
緊接著,2021年3月31日,天數智芯正式對外發布全自研高性能云端7nm芯片BI及產品卡,實現國產云端高性能GPGPU芯片從0到1的突破。在算力方面,天數智芯BI產品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數智芯在BI產品“點亮”時提到,BI產品的理論峰值性能達市場主流產品的2倍。一時間,國產GPGPU似乎已經站在世界之巔。但天數智芯產品副總裁鄒翾在接受電子發燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內的軟件生態是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現有軟件生態上充分發揮芯片的計算力,提供優秀的實測性能,這是國產GPGPU 發展的關鍵。”

天數智芯產品副總裁鄒翾
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發揮GPGPU硬件潛力的必要一環,讓抽象的算力資源能夠和具體應用深度結合。目前,在GPGPU領域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺,還是TensorFlow/PyTorch等主流深度學習開發框架,主導者都是國際廠商或機構。鄒翾認為:“自己的軟件平臺一定是需要的,但目前來說,我們與國外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對比,還包括產品的覆蓋范圍、生態等方面。尤其是生態建設,這是國內廠商必須要面對的問題。”他還說到,國內企業一定要敢于承認這種差距,在解決這些問題以后,國內的運算平臺才會有真正的用武之地。我們企業還是要圍繞怎么解決用戶需求去發展,在這個過程中不斷追趕并縮小這種差距。。
在天數智芯的系統軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調API兼容業界主流生態以及無痛遷移。“提供高效率的軟件結構,最大限度降低已有客戶的開發遷移成本,極大地影響著整個產業的發展。” 鄒翾指出,“天數智芯在產品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發成本。我們考慮到GPGPU產品架構的通用兼容性,本著以客戶需求為出發點的原則,從實際角度為客戶實現跨平臺轉換的無痛遷移。”
從云端走向更廣闊的場景
在天數智芯BI產品的介紹中我們看到,這款全自研通用計算GPGPU芯片聚焦于云端訓練市場。長期以來,云端訓練市場被國際巨頭壟斷,不僅加速卡產品成本高,且生態較為封閉,制約了AI產品多元化發展和升級迭代。鄒翾介紹說,BI產品是國內第一款全自研、真正基于通用GPU架構的GPGPU云端高端訓練芯片,以比同類產品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能。總結而言,BI產品有以下幾個優勢:
a) 全自研IP核心;
b) GPGPU架構,更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態兼容,客戶的跨平臺開發成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務。”
在采訪的過程中,我們談到了端側AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經被驗證的芯片架構。AI端側發展會驅動應用背后更多新型函數和新型算子的出現,這些需求將被融合到GPU未來的軟硬件開發中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結:
GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構間的產品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業的標桿,不僅擁有百萬開發者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優勢,再考慮到產業生態,國產GPGPU替代還有很長的路要走。在NVIDIA官網有提到,AI應用不僅需要大的內存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數據按照同樣的處理流程進行高效并行處理,CPU的優勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現的,而且以前也存在這種整合性的產品,但是對于高端的、云端的CPU加上GPU同時實現,需要非常大的尺寸規模,而且會限制芯片在各自領域的性價比。
天數智芯的下一步
艾瑞咨詢此前在相關報告中指出,2020年中國人工智能基礎層市場規模為497億元,為AI產業總規模的33%,AI芯片的高增長是產業規模增長的主要推動力。未來,算力模塊的智能服務器國產化率將逐步提升。毫無疑問,云端訓練在未來很長一段時間內仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續發展與應用落地,端側及邊緣側未來對算力性能的要求會越來越大。其中,數據中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數智芯的產品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數智芯始終以市場需求為導向,結合公司技術優勢,關注客戶需求痛點并推出適合的GPGPU產品。隨著城市數字化轉型,傳統行業智能化轉型升級需求逐漸擴大,5G、大數據中心、人工智能、工業物聯網、無人駕駛、智慧城市等眾多智能應用領域對高端GPGPU芯片產品的需求量都在急劇增加。”
2021年3月1日,天數智芯對外宣布完成12億元人民幣的C輪融資。在企業高速發展的過程中,除了資金要到位,人才是重中之重。“天數智芯目前已經擁有了一支全球頂尖的數字集成電路設計與基礎軟件設計科學家團隊,為實現公司‘做算力引擎,創世界一流’的愿景而砥礪前行。這支完整的GPGPU研發團隊,由公司聯合創始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總人數85%以上,這其中既有一批行業經驗超過20年的世界級技術專家,也有一大批擁有5-15年業界經驗的高執行力技術菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業務發展,我們將會持續不斷地吸納優秀人才深耕國產GPGPU芯片設計。隨著新產品的推出,團隊也將進一步擴大。另外,根據我們產品規劃和市場發展需要,天數智芯也會進一步通過融資支持公司的長遠發展。”
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
軟件
+關注
關注
69文章
5152瀏覽量
89210 -
天數智芯
+關注
關注
0文章
99瀏覽量
6174 -
GPGPU
+關注
關注
0文章
30瀏覽量
5120
發布評論請先 登錄
相關推薦
熱點推薦
CPU\GPU引領,國產AI PC進階
電子發燒友網報道(文/黃晶晶)當前AI PC已經成為PC產業的下一個浪潮,國產CPU、GPU廠商在PC市場一直處于追趕態勢,AI PC給了大家新的機遇,在這個賽道國產廠商加速了布局與滲透。 首款國產

國產濾波器,如何破局!
國產濾波器突圍戰: 三重挑戰下的產業進階之路 隨著 5G 網絡的規模化商用、RedCap 技術的加速部署、車載V2X的逐步覆蓋以及衛星直連通信的落地,移動終端對射頻前端(RFFE)的性能要求與數量
突發!全球三大家EDA斷供大陸,國產EDA崛起?
半導體產業的脫鉤。雖然我們目前都在講國產替代,但還是要正視跟美國的差距,目前全球三大家EDA公司:Synopsys、Cadence和西門子EDA(被收購前叫Men

國產 vs 進口貼片固態電容:技術差距縮小,本土化替代加速
差異、市場表現及未來趨勢,探討國產替代的機遇與挑戰。 ? 1.性能對比:國產技術迎頭趕上 ? (1)關鍵參數差距縮小 ? - ESR(等效串聯電阻):早期國產固態電容的ESR較高,影響

深度對比:全國產電腦替代方案VS進口設備,性能差距縮小至15%的真相
在工業、金融、能源等領域,進口電腦設備長期占據主導地位,但高昂的成本和技術依賴風險成為企業痛點。如今,以華頡工控機為代表的全國產電腦替代方案,通過CPU、操作系統、芯片組的全面國產化,將性能差距從過去的50%以上縮小至15%以內

國產變頻器與國外品牌存在的差距分析
近日有網友問到:國產低壓變頻器跟合資低壓變頻器的差距到底在哪里?不是說低壓的變頻器其實國內跟合資已經是差不了多少,只是品牌效應?是在芯片?算法?員工素質?高壓變頻器國產跟進口的是不是差距

國芯科技:已結束基于RISC-V架構GPGPU研發
的GPGPU內核研發工作,2024年7月公司已完成第一版RTL代碼設計并對外公開發布。由于公司聚焦汽車電子芯片、服務器和云應用安全芯片、量子安全芯片以及AI MCU芯片的研發及設計,RISC-V GPGPU當前階段的研發工作已結束,未來公司將視國際上開源RISC-V
中科銀河芯的國產替代之路
最近國際形勢復雜多變,使得相關半導體領域貿易不確定性增強,國產芯片的自主可控產業鏈需求變得更加迫切,“國產替代”又成為了一個熱門且關鍵的議題,這不僅是對技術限制的回應,也是國產芯片產業邁向高端化、實現自主可控的必經

龍芯中科首款GPGPU芯片9A1000計劃明年流片
龍芯中科在GPU領域邁出了堅實步伐,其首款集成自研GPGPU核心的2K3000芯片已在上半年成功交付流片,標志著龍芯在終端應用市場的深入探索。更令人矚目的是,其首款GPGPU芯片9A1000計劃于今
國產FPGA的發展前景是什么?
,提升產品性能和技術水平。通過與國際巨頭的合作與競爭,國產FPGA在容量、制程、性能等方面逐步縮小與國際先進水平的差距。
技術創新:國產FPGA廠商積極探索新技術、新應用,如SoC FPGA(系統級可編程
發表于 07-29 17:04
評論