工業和信息化部高新技術司近日公布2024年未來產業創新發展優秀典型案例申報成果,壁仞科技作為牽頭單位,聯合上海儀電、中興通訊申報的 “軟硬一體異構協同的國產GPU智算集群解決方案”,成功入選工信部未來產業創新發展“標志性產品”優秀典型案例。壁仞科技是“未來信息”方向“標志性產品”類別唯一芯片設計企業及上海市唯一上榜企業,充分體現了壁仞科技在人工智能芯片和智算集群領域的技術創新和產品實力。
創新標志性產品“超大規模新型智算中心”方向唯一上榜企業
為落實工業和信息化部等七部門《關于推動未來產業創新發展的實施意見》的部署要求,充分發揮標桿和樣板的示范引領作用,加快推動標志性產品打造、高水平產業主體培育和應用場景建設,工業和信息化部高新技術司組織開展了2024年未來產業創新發展優秀典型案例征集工作。案例征集工作聚焦未來制造、未來信息、未來材料、未來能源、未來空間、未來健康等六大方向,面向全國征集遴選標志性產品、領軍企業和典型應用場景三類典型案例。其中,標志性產品的定義為“代表未來產業發展方向,且已實現產業化,能切實體現前沿技術突破并具有良好應用前景的產品”。
在十大創新標志性產品方向中,“超大規模新型智算中心”旨在加快突破GPU芯片、集群低時延互連網絡、異構資源管理等技術,建設超大規模智算中心,滿足大模型迭代訓練和應用推理需求。壁仞科技自主創新研發的“軟硬一體異構協同的國產GPU智算集群解決方案”成為該方向唯一上榜產品。
六項核心技術創新成果,突破大規模智算集群及異構算力孤島難題
大模型參數從千億擴展到萬億,訓練資源從千卡需要擴展到萬卡甚至十萬卡的集群。DeepSeek引爆了大模型的落地應用,推理資源需求激增。但高端算力供應緊張、國產芯片百花齊放、智算中心擴容混建,形成大量異構算力孤島,智算集群的資源利用效率和靈活性存在很大挑戰。
本案例基于壁仞科技國產高性能GPU打造了軟硬一體、全棧優化、異構協同、自主可控的智算集群解決方案,實現智算集群資源的高效利用及異構協同,支持大模型快速發展。本案例堅持自主創新,整體方案覆蓋高性能集群、大模型訓練一體平臺、加速庫、基礎框架、超大模型框架、算法/應用等六個層次,取得六項業界首創成果:
1)業界首創利用Chiplet架構實現大算力GPU;
2)國內第一次實現GPU跨節點光互連技術驗證并實現商用落地;
3)業界首創大模型3D并行彈性訓練,通過訓推一體平臺實現集群高效調度利用;
4)業界首創三級異步Checkpoint,實現低開銷、高可靠斷點續訓;
5)業界首創異步Offload技術,突破大模型訓練的顯存瓶頸;
6)業界首次支持4種及以上不同廠商不同型號的GPU混合訓練同一個大模型,實現數千卡規?;煊?,突破大模型異構算力孤島難題。
商業化落地加速,技術迭代持續領跑
本案例方案已經在多個大規模智算集群落地應用,通過應用落地和生態、標準建設持續打磨技術,技術持續升級滿足客戶新興重要需求,形成良性循環。目前,壁仞科技壁礪系列通用GPU產品已經在中國電信落地千卡集群并開展商業化落地應用,千卡集群、千億參數模型訓練線性加速比超過95%,多次運行loss零誤差持續收斂,連續訓練30天不中斷,連續訓練5天無故障,千卡集群千億參數斷點續訓時間小于5分鐘,滿足大模型訓練的性能、精度、穩定性要求。壁仞科技自主研發了BIRENLINK高速互連技術,原生支持跨節點的多機高速光互連通信,業內首次完成技術可行性驗證,之后聯合上海儀電旗下上海智能算力科技有限公司設計并建設了首批國產大規模光互連集群,實現了國產光互連集群的技術突破。
為解決大模型異構算力孤島難題,壁仞科技自主研發了異構GPU協同訓練方案HGCT,業界首次支持四種異構GPU混合訓練同一個大模型,完成數千卡混訓落地,實現了異構算力的有效聚合,將逐步實現萬卡異構集群?;贖GCT方案,壁仞已聯合中國移動發布“芯合”異構混合并行訓練系統,聯合中國電信、中興通訊等發布“智算異構四芯混訓解決方案”,牽頭推動智算集群異構混訓標準建設工作,實現技術創新、落地應用、標準制定的有機結合。
躋身新質生產力標桿,共建開放智算生態
憑借技術創新與商用落地能力,壁仞科技的超大規模智算集群解決方案近期榮登「2024新質生產力產業實踐“人工智能”示范案例」TOP5。未來,壁仞科技將攜手合作伙伴,以基礎軟件棧為核心,構建開放融合的智算生態,推動國產算力從“可用”向“好用”躍遷,支撐更大參數規模模型、更大規模異構集群及多業務場景融合,為中國算力強國戰略提供堅實底座。
-
gpu
+關注
關注
28文章
4910瀏覽量
130653 -
人工智能
+關注
關注
1804文章
48701瀏覽量
246468 -
壁仞科技
+關注
關注
1文章
67瀏覽量
3063 -
大模型
+關注
關注
2文章
3025瀏覽量
3825
原文標題:壁仞科技入選工信部2024年未來產業創新發展“標志性產品”優秀典型案例
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論