進入2025年,百模大戰的參賽者數量收斂了一個數量級,基模牌桌上已經由200多家淘汰至十幾家。盡管如此,基模競賽仍然未到終局。
從模型能力看,多模態大模型僅達到LLM大語言模型兩年前的水平,仍在加速進化中。LLM大語言模型的上限也還有提升空間,年初DS帶火的基于長思維鏈實現慢思考的推理能力,各家都積極探索。
從市場格局看,領先者座次也在動態變化中。中國信通院的調研發現,2024年4月還是OAI處于領先,到年底文心就超過了GPT,國內模型能力在快速上升。
百模大戰至今,仍未塵埃落定。說明模型競賽是一場技術馬拉松,靠的不是一時一刻的領先,而是持續不停地奔跑。ChatGPT、文心、DS等現象級產品,本質上都是大模型從高技術領域轉入普及型全民應用的一個產品,并不是AI大模型技術體系的全部。
模型的創新之花持續綻放,常開不敗,離不開底層AI技術體系的長期積累。而放眼國內,百度的AI底蘊,尤其是它的技術全棧布局確實是有目共睹的。
5月20日百度AI Day活動上,百度集團副總裁吳甜也分享了文心大模型最新技術進展。在現場,我們感受到,文心4.5系列在多模態、深度思考、復雜推理、智能體等技術方向上,持續演進。
那么,百度能否戰至基模終局?我們深入文心4.5的技術機理,為大家扒開百度的AI根系。
當下,基礎模型創新已經進入了技術摸高階段,低處易摘的果實都被摘完了,高處的果實又很難被摘下。比如確定性場景下的幻覺問題,類推理模型的深度思考能力還無法解決現實復雜難題等,都很具挑戰性,但又是行業應用大模型時的痛點。
基模還能出現大幅度的升級迭代嗎?這時候,文心大模型帶來了肯定的答案。近兩個月以來,文心大模型的技術創新,在速度和銳度上都很突出:
進化速度快,3月16日百度對外發布了文心4.5和深度思考模型文心X1。1個多月之后,就發布了文心4.5 Turbo和X1 Turbo。硬剛的百度又重回大模型視野中心。
創新點硬核,具有技術銳利度和識別度,比如文心4.5T/X1 T的最新更新,所采用的技術方法就跟此前和業界主流有較大突破。中國信通院的大模型推理能力評估結果也顯示,百度文心X1 Turbo在24項能力評估中,綜合評級獲當前最高級“4+級”,成為國內首款通過該測評的大模型。
主要在兩個領域有較大突破:
一是多模態領域。文心大模型4.5是多模態基礎大模型,文心4.5 Turbo源自文心4.5。文心4.5系列模型實現了文本、圖像和視頻的混合訓練。通過構建針對不同模態的“異構專家”,為每種模態設計專門的處理模塊。這些模塊能夠根據各自模態的特點進行優化,例如圖像模塊專注于視覺特征提取,文本模塊專注于語言理解,而視頻模塊則結合了時間和空間信息的處理能力。這種設計使得文心4.5 Turbo能夠充分照顧到不同模態的特點,文本、圖像和視頻數據無縫融合,從而實現更高效的多模態學習。
結果就是,文心4.5/4.5T的多模態理解能力有比較大的提升,也讓不少相關AI應用如虎添翼。比如OCR翻譯,文心4.5 Turbo可以迅速識別單據中的外文并翻譯出來;解答理科題目,可以對圖像進行更好地理解與分析,明確已知條件和所求問題,再整合工具獲取到的信息和自身知識,給出最終答案。
二是推理模型reasoning model的深度思考能力。文心X1升級到X1 Turbo,得益于文心4.5 Turbo多模態大模型的增益,X1 Turbo在深度思考上更進一步,實現了更先進的思維鏈,可進行多步驟的邏輯推理、工具調用和多模態理解能力。
具體來說,深度思考模型爆火之后,各家都在探索進一步優化。但大多數優化都集中于單步驟,讓模型通過單步思考、單步調用工具來解決問題。但全靠人一步步填鴨式教學,教AI怎么做,不僅效率低下,而且模型能力提升有限。因此,需要讓模型自主進行多步思考,學會舉一反三。
百度在后訓練環節,設計了多元統一獎勵機制,提升模型對結果質量的判別。有了這種多元評判能力,大模型就可以思考很多步,謀定而后動,最后做出最優行動決策。這種多元獎勵機制的強化學習,可以讓模型探索出更復雜、多步驟的思維鏈和行動鏈,讓模型在解決真實的長程、復雜性的任務上會有更好的表現。
最硬核的創新之花,同時出現在多模態和推理領域。這說明,哪怕是在創新難度更大的技術摸高階段,百度仍穩穩站在第一梯隊。
“百度2019年發布文心1.0,從那時到現在,百度大模型技術發展是一脈相承的”,吳甜說到。
大模型持續演進,為什么技術根脈很重要? AI不是一招鮮,而是需要通盤考量的綜合問題。
在吳甜看來,模型上限仍有提升空間,而打開空間是需要很多前提條件的:
1.數據層面來看,在大模型基礎體系中,很多人覺得數據建設就是一些標記、清洗等簡單處理工作,但數據建設的許多問題如果解決好了,模型會更高效地學到東西。比如文心4.5 Turbo是多模態模型,所以在多模態數據建設方面,就有許多新的工作,像是多模態的平行數據的構建,讓模態和模態之間的知識和信息能夠共享。此外,模型融合線上反饋的數據進行挖掘,讓模型可以有針對性地改進和提升。
2.知識角度,基于知識點的大規模稀缺數據構建也是這次模型的重要創新點。比如通過百度積累的知識體系,可以檢測模型的數據分布上有一些地方是欠缺數據的,是冷門的、沒什么人用的知識,再針對性地積累和挖掘。更完備的知識體系,可以為文心大模型提供高質量的訓練數據。
3.算法層面,文心4.5 Turbo和X1 Turbo在多模態能力上的表現出色,也與百度多年所積累的算法研發能力相關。除了前面說到的多模態異構專家建模,百度還引入了時空信息編碼技術、自適應模態感知損失計算等前沿技術。綜合下來,讓文心4.5 Turbo在訓練過程當中學習效率提高了1.98倍,多模態理解效果也有相應的提升。
而在深度思考方面,百度研制了自反饋增強的技術框架,來優化整個模型訓練的過程,讓訓練的過程更加有效率,而且顯著降低了模型幻覺,模型理解和處理復雜任務的能力大幅提升。
當前模型算法層面還需要不斷創新,去提升大模型性能。百度的AI信仰、技術底蘊與人才厚度,支撐著文心持續演進。
4.基礎設施infra。大模型性能提升的同時,成本下降也是至關重要的。基礎設施層面的積累,對文心4.5 Turbo/X1 Turbo的研發起到了關鍵作用。文心4.5 Turbo是一個MoE架構的多模態模型,不同模態差異帶來的問題更加凸顯,不同模型的損失計算協同通信也是難題。而且模型的訓練周期很長,訓練過程當中,故障中斷的解決、自動的恢復等,對基礎設施提出了很高要求。繞到文心大模型背后,會發現是深度學習平臺飛槳多年的積累以及不斷扎實的整個平臺的技術能力,支撐著文心大模型的快速迭代。
上述因素,也只是百度AI根系的冰山一角。百度龐大而復雜的AI根系,以及全棧式的AI布局滋養著文心大模型的創新常在。隨著大模型走向技術摸高,百模大戰也臨近終局,我們越來越強烈地感受到,基模很難靠單一技術熱點就能屹立不倒。
一方面,摘下高技術領域的果實,需要多要素的長期投入和跨領域協作。另外,進入技術無人區,當主流技術路線遭遇瓶頸時,擁有完整技術體系的企業可以快速切換路徑,或嘗試多技術交叉的新路徑。
所以,當基模競爭的烈度進一步加劇,在風云變幻的技術浪潮中,根系深厚者才可以穿越周期,持續領跑。
文心能否站到終點?做科技媒體這么多年,一直會有讀者問我們,“百度AI說得那么強,怎么總是趕不上熱席”。但只要讓子彈飛一會兒,等到真的需要跟世界一流掰手腕的時候,百度卻從未缺席。這是為什么?百度AI的獨特性,被一位高一的小朋友敏銳洞察到了。
來自福建省惠安第三中學的陳君航,在本次開放日上分享了自己使用文心的感受:“技術真正的魅力不是驚艷誰,而是真正解決一個又一個真實的問題。”
他從2023年開始,用文心一言中考備考,定制學習計劃,解析搜題軟件中無法解析的原創題目,還用文心一言編程寫代碼,為媽媽做了一款“智能文案生成器”的軟件。
教育、解題、編程,這些都是現實場景中復雜的任務要求,需要AI大模型控制幻覺、嚴密思考推理,確??尚偶翱捎眯浴_@種與場景更適配的使用感,是靠多種技術體系協同解決,以及工程上的系統性創新才能實現。文心大模型,就是在做這樣實用的AI。
可以說,文心大模型一直走的是真實實用的路線,演進方向在思考能力建設上的體現是結構化和專業化。
比如X1的先進思維鏈與多模態能力,就可以讓個人和行業伙伴/企業用戶去完成更復雜的任務,基于文心的基模能力,打造代碼智能體、直播數字人,可以真正幫助程序員、企業營銷人員解決現實難題。
所以,文心大模型,不是看得見摸不著的海市蜃樓,而是可以真正被個人和企業移栽到自身生活工作場景中去的AI綠洲,生長著文心系列的一棵棵巨樹,可以被嫁接到真實場景,結合各行各業的獨特水土,培育出自己的AI根苗。
進一步讓AI在產業落地生根,百度多年來也在生態上做了大量基礎工作,幫助行業育苗樹人。目前,飛槳和文心整個生態上有開發者2815萬,支持的企事業單位有67萬,模型已經達到了110萬。在這個繁榮的AI生態中,智能中國也蔚然成蔭。
進入2025,大眾與行業都很關切:百模大戰,文心能否站到終點?我們不妨拆解為三個小問題:
根在技術的百度,有世界一流的創新能力與首屈一指的技術團隊,能否始終確保文心大模型的先進性?
根在全局的百度,具備快速調整技術路徑的戰略縱深,在瞬息萬變的技術領域,相比押注單一主流技術趨勢的模廠,百度是否更具彈性和韌性?
根在現實的百度,擁有自主研發的昆侖芯/計算集群、飛槳框架、文心系列模型、繁榮技術生態,那么走向產業時,文心大模型是否更容易被信任?
臨近決賽圈的基模格局正風云變幻,但AI根系深厚扎實的文心,或許才是最無懼風雨的那一個。
審核編輯 黃宇
-
AI
+關注
關注
87文章
33998瀏覽量
274944 -
大模型
+關注
關注
2文章
3001瀏覽量
3768
發布評論請先 登錄
2025年半導體制造設備市場:前景璀璨還是風云變幻?

格靈深瞳亮相Create2025百度AI開發者大會
格靈深瞳入選量子位2025年AIGC雙榜單
格靈深瞳發布全國產超融合大模型一體機
埃科光電相機產品家族介紹
AIoT芯片設計廠商炬芯科技榮獲2025 IC風云榜“年度品牌創新獎”
兆芯榮獲2025 IC風云榜“年度技術突破獎”
集創北方榮獲2025 IC風云榜“年度車規芯片市場突破獎”

評論