電子發燒友網報道(文/莫婷婷)AI大模型應用在2024年進入新的階段。Transformer等技術正在推動著行業從單一模態的大語言模型,向多模態大模型進化。
業內普遍認為,未來3到5年我們會快速邁入AI3.0時代,屆時進入以機器人為代表的具身智能時代,當人形機器人搭載了多模態大模型,和物理世界進行交互后,就會發展成行為大模型,成為自進化智能體,進一步實現AGI通用人工智能,由此打開第四次工業革命的大門。
云天勵飛董事長兼CEO陳寧認為,未來3年全球80%的企業將使用大模型,未來5年機器人和數字人的數量將超越人類的數量,未來7年,也就是到2030年行業將實現通用人工智能,AI的智慧程度超越全人類大腦的組合。
他進一步提到,我們還有3年的時間可以轉型到大模型時代,借助大模型生產力的變革去賦能企業。那么,企業如何擁有屬于自己的大模型,訓推一體機成為焦點之一。
千元級AI模盒,大模型進入平民化階段
目前,行業內已經有多家企業推出訓推一體機,但是在訓練專屬大模型過程中,訓推一體機的痛點也隨之暴露出來。成本是其中一個關鍵問題,主流的訓推一體機價格普遍在百萬級。另外還有大參數、大算力、大數據、專業人才等,要知道GPT-4模型訓練數據ToKen量已經達到130000億。為了加速AI普惠化,訓推一體機亟需迭代。
就在今年3月,云天勵飛推出“深目”AI模盒,面向邊緣訓推場景。官方介紹,“深目”AI模盒搭載了自研的14nm Chiplet大模型邊緣訓推芯片DeepEdge10 Max、自研多模態大模型“云天天書”,基于云天勵飛的核心能力算法芯片化,實現了算法場景覆蓋超過90%、算法精度超過90%,使用成本降低90%。其中,DeepEdge10 Max適配并可承載10億級SAM、百億級Llama2等大模型運算。

值得一提的是,“深目”AI模盒售價在千元級。可以說,在一定程度上,云天勵飛將訓推一體機“打下”千元級,促進了大模型平民化,解決大模型在場景落地最后一公里的問題,幫助更多中小企業客戶輕松使用大模型。

智慧城市場景里還存在非常多的問題沒有完全解決,例如長尾場景,只有一個模型能夠解決跨場景的問題,才有可能低成本解決智慧城市的碎片化問題。
在現實問題中,天災人禍等極端場景識別訓練的數據幾乎空白,云天勵飛副總裁羅憶以加油站場景的吸煙識別為例進行介紹,平臺能夠利用大模型能力,以加油站為背景,生成在該環境抽煙行為的人物,并將數據用于算法訓練中,填補訓練數據的空白。
“我們通過可控的生成,對于指定的場景、部位可以做到細節可控、真實合理、高保真,而且可以批量生成數據。”目前,云天勵飛已經生成了千萬級的數據用于各類算法的訓練,而且生成的數據不僅能夠用于算法的訓練,還能用于算法能力的測試。
“從生成訓練到檢測,這個閉環打通,也為將來它的自學習奠定基礎。”羅憶再次表示。使用AI合成數據來訓練算法,逐漸成為大模型時代下訓練新算法和提升算法精度的方式之一。
推理芯片將是AI大模型的發展關鍵之一
未來,AI大模型的發展一定是降低推理成本,陳寧在接受電子發燒友網等媒體采訪時表示,關于大模型的訓練,業內的重視度已經比較高了,GPU一卡難求,中國也掀起了智算,上下游的企業都參與到智能算力的建設過程中,云天勵飛也抓住了機遇。“我們認為2024年如果是大模型落地應用之年,推理就會越來越重要。”
云天勵飛自成立之初就將AI芯片定位在推理的應用,此次將其在推理領域的深厚技術積累賦能給了“深目”。
“深目”內置了自研的SPACE訓練推理引擎,羅憶表示,“我們要讓大模型在邊緣側跑起來,不僅要推理,還要具備一定的訓練能力,要提高它的精度,首先要解決速度的問題,確保訓練有效的前提下,只要進行少樣本的訓練,即可進行場景自適應。”

根據介紹,基于SPACE訓練推理引擎的高效訓練架構,對比全量訓練,“深目”AI模盒訓練速度提升100倍,內存消耗降低20倍。通過混合精度訓練,模型99%的計算采用int8+fP16精度訓練,只有不到1%的計算才用得fp32精度訓練。而且做到了存儲及功耗均大幅下降,推理速度同比提升50%,推理成本更是降低10倍。
通過SPACE訓練推理引擎和神經網絡處理器芯片架構的深度耦合,“深目”在邊緣端48T至64T的有限算力情況下,一樣可以實現高精度的推理大模型,并且可以微調和訓練。陳寧表示,面向邊緣場景,云天勵飛強化了多模態大模型場景泛化和在線學習、訓練的能力,通過一系列的性能提升,解決場景價值閉環的問題。
一般來說,AI芯片可以分為兩種:推理芯片、訓練芯片。“但是算法的訓練不是目的,千行百業的推理應用才是最終目的,人形機器人、無人機、無人車、可穿戴設備、AIPC、AI手機等,萬物智聯的智能硬件都需要一顆或者幾顆神經網絡處理器的推理芯片”,陳寧表示。
2024年,AI行業在推理芯片領域迎來了新的進展。例如,AI芯片創企Groq自研的新型AI芯片——LPU(Language Processing Units)在AI行業內“出圈”,該芯片專為AI推理而生。公開資料顯示,由Groq LPU驅動Meta Llama 2模型,推理性能可以做到頂級云計算供應商的18倍。英偉達在GTC 2024上也發布了全新的 GPU——Blackwell芯片,推理能力是Hopper的30倍。
如今,推理芯片領域還沒有壟斷性的巨頭,推理芯片是一個萬億顆芯片的大藍海市場,而中國市場擁有豐富的場景,未來推理芯片會應用到各個行業中,解決各個場景的問題,國內的AI芯片企業也會在推理芯片領域迎來新的進展。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
云天勵飛
+關注
關注
0文章
147瀏覽量
12002 -
AI大模型
+關注
關注
0文章
362瀏覽量
498
發布評論請先 登錄
相關推薦
熱點推薦
中軟國際推出昇騰金融AI解決方案和一體機v1.0
解決金融客戶面臨的諸多業務難題。 中軟國際昇騰金融AI一體機硬件配置強大,整體性能卓越穩定。軟件層面,該方案集成了豐富的功能組件。大模型訓
一夜爆火的DeepSeek一體機,如何改寫AI游戲規則?
DeepSeek一體機,都不好意思說自己懂AI。” 所謂一體機,通常匯集了中央處理器(CPU)、圖形處理器(GPU)、存儲器、操作系統、AI 軟件平臺以及各類

中科曙光推出DeepSeek人工智能一體機
為滿足用戶對DeepSeek的多方位需求。近日,中科曙光推出DeepSeek人工智能一體機。該一體機集多形態曙光高端計算服務器、高效能基礎模型、全流程AI工具鏈于
DeepSeek一體機:加速AI訓推超融合,推動行業智能化落地
本地部署推出FusionCube A3000訓推超融合一體機,以“數據-模型-應用”全流程創新,破解大模型落地難題,助力企業低成本、高質量推

格靈深瞳發布全國產超融合大模型一體機
大模型一體機最大的亮點在于其支持單臺運行DeepSeek-R1滿血版。DeepSeek-R1是格靈深瞳自主研發的一款高性能AI大
華為推出昇騰DeepSeek大模型一體機
DeepSeek大模型的橫空出世,讓AI正以前所未有的速度重塑各行各業的發展格局。昇騰DeepSeek一體機深度融合昇騰高性能算力底座與DeepSeek全系列大
澎峰科技發布萬元級DeepSeek智算一體機
萬元級滿血DeepSeek智算一體機——智算先鋒Deep Fusion DF100。 這款劃時代的產品不僅將大模型的私有化部署帶入了萬元時代
寧暢推出DeepSeek大模型一體機
為加速人工智能大模型技術在企業級場景中的規模化落地,寧暢正式發布DeepSeek大模型一體機解決方案。作為一款面向企業的“開箱即用”智能算力
云從科技從容大模型訓推一體機成功適配DeepSeek
了新的動能。 從容大模型訓推一體機是云從科技基于昇騰AI基礎軟硬件平臺推出的創新產品。該產品集成了大模型
云天天書大模型訓推一體機成功適配DeepSeek
近日,云天天書大模型訓推一體機成功適配DeepSeek。該一體機由云天勵飛與華為聯合推出,可以部署在華為昇騰服務器上,支持私有化部署,實現開
新華三發布DeepSeek大模型一體機UniCube
,為各行各業的智能進化注入了全新動力。 UniCube一體機實現了671B DeepSeek大模型的單機推理及單機訓
雷曼智慧一體機獲得最高能效等級一級認證
近日,雷曼智慧會議/教育交互大屏(以下簡稱“雷曼智慧一體機”)成功通過國家權威認可實驗室的檢測認證,依據最新國家標準《顯示器能效限定值及能效等級》(GB 21520-2023),其能源效率等級達到高性能LED一體機的最高等級
評論