在AI技術重塑全球產業格局的進程中,計算范式正經歷從運算器為中心到存儲器為中心的范式躍遷。這一變革重新定義了“先進存力”的邊界。
得一微電子首次創造性地提出“AI存力芯片”的技術概念。未來 AI 系統的每個單元都將智能體化。AI 存力芯片致力于將先進存力的 AI 智能體用芯片實現,并主動為 AI 系統的GPU/NPU提供有價值的計算卸載和數據洞察。這一創新成果將大大提升整個系統的運行效率和智能化水平。
從存儲到存力,技術路徑的跨越式升級
作為國內少數具備完整存儲控制芯片自主研發能力的企業,得一微正迎來其發展歷程中的“高光時刻”:一方面,公司的存儲控制芯片產品順利導入手機頭部廠商,PCIe SSD主控產品線持續突破;另一方面,得一微在工規和車規存儲市場取得重要突破。尤其是在車規產品方面,公司更是連續多年實現了翻倍式增長,這進一步鞏固了公司的實力。
在AI席卷全球的當下,得一微與時俱進,啟動開拓AI存力芯片的戰略升級。
“在過去的計算范式中,存儲只是圍繞著 CPU,為其提供服務,存儲的數據也僅僅是數據。但進入AI時代,存儲的核心數據變成了大模型的參數,神經網絡的權重,還有向量化的知識。與此同時,GPU也取代CPU,成為了存儲的新‘大哥’”,得一微電子市場總監羅挺在此前的CFMS|MemoryS 2025 現場告訴半導體行業觀察。
伴隨著這種情況的產生,對系統的理解變了,存儲及其在系統中扮演的角色也變了。
如羅挺所說,當前,AI無論是存儲和推理都用到了很多的GPU,GPU逐漸顯現出算力主導地位。在GPU的指導下,數據按照需求在系統中高速運轉。但在這個過程中,系統開始出現了諸多問題。例如,HBM成為了成本和性能的瓶頸,SSD/UFS的設計依然是以CPU為中心,這都是AI系統的方案供應商和供應鏈需要著重解決的關鍵問題。
作為一家以芯片創新和解決方案聞名的供應商,得一微對此也有了自己的思考。
“在AI快速發展的時代,我們需要調整整個產品的思路。”羅挺表示。他以Transformer架構的LLM舉例說道,當前,無論是Prefill和Decode,注意力還是KV Cache, 向量數據庫還是知識圖譜的訪問,都是在GPU上運行。然而,這種高度集中的計算方式很快遇到了帶寬的瓶頸。
“在得一微看來,以存算一體為核心的存力芯片,將改變神經網絡的計算方式,AI存力芯片才是未來。”羅挺說。
AI-MemoryX,是AI存力芯片的探索
得一微此前發布的AI-MemoryX顯存擴展卡,就是得一微針對新型需求的成功嘗試。
該方案通過創新架構,將單機顯存容量從傳統顯卡的幾十GB提升至10TB級別,僅需1到16張顯卡,即可支持32B至671B等超大模型的微調訓練,大幅降低對GPU的數量需求,突破大模型訓練的顯存瓶頸。
“AI-MemoryX不僅是一張擴展卡,更是一套完整的微調訓練機解決方案。”羅挺強調。該技術涵蓋大模型訓練框架、顯存擴展卡軟件棧以及顯存擴展卡X200系列,為大模型微調訓練提供全方位的技術支持與賦能。目前,該方案已成功應用于DeepSeek等大模型的訓練優化,協助開發者發掘微調的潛力和價值,推動AI技術在各行業的快速落地。
隨著AI-MemoryX技術的迭代創新,得一微將在各個應用場景推出AI存力芯片和解決方案。
AI存力芯片,重構計算范式
也許很多讀者會和筆者一樣,對于以前專注于存儲的得一微,為何能夠迅速轉向這些看來與計算有著更多關系的產品。
針對這個問題,羅挺表示,公司做的產品創新和產品線拓展,主要還是圍繞著存儲(存儲控制,存算一體,存算互聯)展開。在公司過去打造這些產品的過程中,長年積累的硬件、軟件、算法和SoC等方面的經驗和人才,這也是公司能構建AI存力芯片新技術路徑的底氣。
展望未來的發展,羅挺表示,公司會堅持三步走戰略:第一,利用現有的芯片和軟件,打造出能快速創造價值的AI存力解決方案;第二,把軟件的創新放到芯片里面固化,將算法創新轉化為芯片能力;第三,推動AI存力芯片的應用和生態建設。
過去幾年,國內芯片行業最大的狀態就是內卷,眾多廠商圍繞著類似的產品定義展開激烈的競爭,除了精益求精,如何尋找方向?得一微通過AI存力芯片的創新,開辟了新的技術賽道,更為中國存儲產業的升級發展提供了示范。未來,隨著AI存力需求的持續增長,存力將從被動支撐算力到主動驅動算力,得一微的“AI存力芯片”,讓每比特數據創造更多智能。
審核編輯 黃宇
-
芯片
+關注
關注
459文章
52181瀏覽量
436186 -
AI
+關注
關注
87文章
34223瀏覽量
275389
發布評論請先 登錄
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

評論