10月17日,以“生成未來”為主題的百度世界2023在北京首鋼園舉辦,百度首席技術(shù)官王海峰解讀文心大模型4.0背后的關(guān)鍵技術(shù)和最新進展。王海峰表示,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升,9月已開始小流量上線,過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今,用戶規(guī)模已經(jīng)達到4500萬,開發(fā)者5.4萬,場景4300個,應(yīng)用825個,插件超過500個。
文心大模型4.0首發(fā) 理解、生成、邏輯和記憶能力顯著提升
據(jù)了解,百度在3月16日發(fā)布知識增強大語言模型文心一言。文心一言從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學(xué)習(xí),得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋強化學(xué)習(xí)、提示等技術(shù),具備知識增強、檢索增強和對話增強的技術(shù)優(yōu)勢。
文心一言的基礎(chǔ)模型5月升級至文心大模型3.5,在基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強、插件機制等方面創(chuàng)新突破,取得效果和效率的提升。
今天發(fā)布的文心大模型4.0,相比3.5版本,理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。百度基于文心大模型研制了智能代碼助手Comate,從內(nèi)部應(yīng)用效果來看,整體的代碼采納率達到40%,高頻用戶的代碼采納率達到60%。
據(jù)悉,文心大模型4.0在9月已開始小流量上線,過去一個多月效果又提升了近30%。訓(xùn)練算法效率自3月以來已累計提升3.6倍,周均的訓(xùn)練有效率超過98%。文心大模型4.0基本技術(shù)架構(gòu)與3.0和3.5版本一脈相承,并在多個關(guān)鍵技術(shù)方向上進一步創(chuàng)新突破。
在萬卡算力上運行飛槳平臺,通過集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了大模型的穩(wěn)定高效訓(xùn)練。建設(shè)了多維數(shù)據(jù)體系,形成了數(shù)據(jù)挖掘、分析、合成、標注、評估閉環(huán),充分釋放數(shù)據(jù)價值,大幅提升模型效果。基于有監(jiān)督精調(diào)、偏好學(xué)習(xí)、強化學(xué)習(xí)等技術(shù)進行多階段對齊,保證模型更好地與人類的判斷和選擇對齊。可再生訓(xùn)練技術(shù)通過增量式的參數(shù)調(diào)優(yōu),有效節(jié)省了訓(xùn)練資源和時間,加快了模型迭代速度。
此外,文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面,對用戶輸入的問題進行理解,并拆解出回答問題所需的知識點,然后在搜索引擎、知識圖譜、數(shù)據(jù)庫中查找準確知識,最后把這些找到的知識組裝進Prompt送入大模型,準確率好,效率也高;另一方面,對大模型的輸出進行反思,從生成結(jié)果中拆解出知識點,然后再利用搜索引擎、知識圖譜、數(shù)據(jù)庫,以及大模型本身進行確認,進而對有差錯的點進行修正。
在強大的基礎(chǔ)大模型的基礎(chǔ)上,百度進一步研制了智能體機制,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行、自我進化,并一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實現(xiàn)自主進化。
文心一言助力國圖館藏文化資源活化 升級國家跳水隊AI輔助訓(xùn)練系統(tǒng)
百度已經(jīng)與中國國家圖書館展開戰(zhàn)略合作,發(fā)揮各自的資源、技術(shù)和服務(wù)優(yōu)勢,共同推動文化資源和知識服務(wù)智能化,普惠大眾。國家圖書館擁有全球最大的古代方志,利用文心大模型學(xué)習(xí)古代方志與家譜數(shù)據(jù),幫助全球華人獲取更多尋根線索。王海峰現(xiàn)場分享了海外華人趙佩娟延續(xù)祖父鄉(xiāng)愁,成功“尋根”的故事。
中國國家跳水隊教練、奧運五金王陳若琳和奧運冠軍全紅嬋、陳芋汐、王宗源也來到世界大會現(xiàn)場,與王海峰熱切互動,解密夢之隊訓(xùn)練“獨門絕技”。基于文心一言等百度大模型技術(shù),中國國家跳水隊AI輔助訓(xùn)練系統(tǒng)全面升級,通過從海量數(shù)據(jù)和知識中學(xué)習(xí),掌握了豐富的跳水知識,理解和執(zhí)行教練員和運動員的復(fù)雜指令,及時提供準確信息,并對動作實時打分、精準量化分析,提供最有價值的指導(dǎo)信息,助力中國國家跳水隊高效訓(xùn)練。
現(xiàn)場,陳若琳受中國游泳協(xié)會主席周繼紅委托,授予百度為“中國國家跳水隊人工智能合作伙伴”。陳若琳表示,中國國家跳水隊與百度從2019年就開展了深入的技術(shù)合作,攜手走過了東京奧運會、福岡世錦賽、杭州亞運會,目前正在備戰(zhàn)明年巴黎奧運會。“感謝百度一直以來提供的技術(shù)支持與服務(wù),未來雙方將攜手持續(xù)用人工智能技術(shù)幫助跳水隊智能訓(xùn)練,通過科學(xué)訓(xùn)練提升競技水平。”
百度人才培養(yǎng)星河計劃發(fā)布 再培養(yǎng)500萬大模型人才
王海峰現(xiàn)場公布了百度人工智能人才培養(yǎng)的最新數(shù)據(jù),百度在2020年提出5年為全社會培養(yǎng)500萬AI人才,截至目前,百度已經(jīng)培養(yǎng)了420萬AI人才。
當下,大模型成為人工智能發(fā)展的熱點方向,進一步加速產(chǎn)業(yè)變革,AI人才培養(yǎng)也需與時俱進。王海峰發(fā)布了百度人才培養(yǎng)星河計劃,他表示,“我們將與產(chǎn)學(xué)研各界密切合作,深化產(chǎn)教融合,為社會再培養(yǎng)500萬大模型人才,讓人工智能科技的‘創(chuàng)新之花’,結(jié)出更多‘產(chǎn)業(yè)之果’,服務(wù)國家戰(zhàn)略,服務(wù)社會發(fā)展,服務(wù)人民福祉!”
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1806文章
49008瀏覽量
249293 -
文心一言
+關(guān)注
關(guān)注
0文章
133瀏覽量
1856 -
大模型
+關(guān)注
關(guān)注
2文章
3138瀏覽量
4059
原文標題:百度CTO王海峰:文心大模型4.0首發(fā),文心一言用戶規(guī)模已達4500萬
文章出處:【微信號:baidu_2000,微信公眾號:百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
中興努比亞啟動接入百度文心4.5系列開源大模型
寧暢與與百度文心大模型展開深度技術(shù)合作
百度發(fā)布文心大模型4.5和文心大模型X1
deepseek和文心一言兩者有什么區(qū)別?哪個跟合適您使用呢?
百度搜索與文心智能體平臺接入DeepSeek及文心大模型深度搜索
百度文心大模型4月1日起全面免費開放
機械革命無界X系列輕薄本將預(yù)裝文心一言
模力無限,星河共創(chuàng):啟明云端與您共赴文心大模型生態(tài)大會

評論