作為當前業(yè)界唯一的基于全國產(chǎn)算力訓(xùn)練的深度推理大模型,訊飛星火X1全新升級啦!
本次升級有這些關(guān)鍵信息
實現(xiàn)了數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務(wù)效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個數(shù)量級的情況下,整體效果對標OpenAI o1和DeepSeek R1,再次證明了基于國產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實力和持續(xù)創(chuàng)新的潛力。
融入了更多場景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領(lǐng)先優(yōu)勢。
首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式,私有化部署簡便;全新升級模型定制優(yōu)化工具鏈,支持SFT、強化學(xué)習(xí)兩種模型定制優(yōu)化方案,定制門檻低。
三大核心技術(shù)創(chuàng)新——大規(guī)模多階段強化學(xué)習(xí)訓(xùn)練方法、基于快慢思考的統(tǒng)一訓(xùn)練方法、工程技術(shù)系統(tǒng)創(chuàng)新保障基于國產(chǎn)算力的高效長穩(wěn)訓(xùn)練,助力星火X1全面升級。
星火X1 API已同步上線訊飛開放平臺,面向廣大開發(fā)者和企業(yè)開放服務(wù)。
快來看看本次升級的精彩細節(jié)吧!
此次星火X1升級,在多個任務(wù)上效果繼續(xù)突破,展現(xiàn)出優(yōu)異的性能。根據(jù)最新測試集評測結(jié)果,星火X1在通用任務(wù)效果評測中全面對標OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識問答等方面表現(xiàn)突出。
測試集合來源:自建測試集主要來自真實的大模型請求任務(wù)數(shù)據(jù),來源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務(wù)數(shù)據(jù)等;公開測試集主要以數(shù)學(xué)、答題、推理、代碼等外部典型測試集為主。
升級后的星火X1表現(xiàn)怎么樣?上題,開測!
先來看一道數(shù)學(xué)題
星火X1準確識別出復(fù)雜的數(shù)學(xué)公式,不僅給出完整解題思路,輸出結(jié)果也嚴謹清晰。
再來看一道邏輯推理題
星火X1全方位思考,給出每一種可能的假設(shè),對所有可能性清晰謹慎地探討。
接下來試試代碼題
面對復(fù)雜的代碼需求,星火X1縝密思考,代碼生成的準確率up!代碼能力up!
來考考星火X1的語言理解能力
在語言理解方面,星火X1在輸出內(nèi)容、格式等方面更加符合用戶指令要求,結(jié)果既連貫又準確。
星火X1的長思維鏈能力還支持圖像輸入
星火X1接收到圖像后,立刻開始對輸入的圖像進行關(guān)聯(lián)思考,輕松“拿捏”并給出結(jié)果。
無論是數(shù)學(xué)解題,還是圖片理解,升級后的星火X1都能給出嚴謹、專業(yè)、準確的回答,展示完整、清晰的推理過程,讓大家更能直觀清楚地理解星火X1的思考過程。
星火X1除了在常見通用任務(wù)取得顯著進步之外,由于融入了更多場景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領(lǐng)先優(yōu)勢。
以司法行業(yè)為例
針對司法行業(yè)中的專業(yè)需求,例如根據(jù)材料總結(jié)案件事實以及判決理由,升級后的星火X1關(guān)注用戶指令需求,詳細分析案件爭議點,快速定位材料中的關(guān)鍵信息,準確輸出內(nèi)容。
為了讓更多企業(yè)能夠便捷用上AI,本次升級的星火X1為企業(yè)AI落地提供了雙重支持:
首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式,4張卡(華為910B)即可部署滿血版星火X1,私有化部署簡便。
全新升級模型定制優(yōu)化工具鏈,支持SFT、強化學(xué)習(xí)兩種模型定制優(yōu)化方案,16張卡(華為910B)即可完成行業(yè)定制優(yōu)化,定制門檻低。
星火X1此次全新升級,背后有三大技術(shù)創(chuàng)新:
大規(guī)模多階段強化學(xué)習(xí)訓(xùn)練方法:提出基于問題難度的大規(guī)模多階段強化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語言理解等場景全面提升模型效果及泛化性;同時提出強化學(xué)習(xí)動態(tài)更新算法,基于樣本采樣長度動態(tài)調(diào)整強化學(xué)習(xí)更新速度,進一步提升深度思考強化學(xué)習(xí)效率及效果。
基于快慢思考的統(tǒng)一訓(xùn)練方法:提出統(tǒng)一模型下快慢思考混合訓(xùn)練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進作用,實現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷地部署使用。
工程技術(shù)系統(tǒng)創(chuàng)新保障基于國產(chǎn)算力的高效長穩(wěn)訓(xùn)練:實現(xiàn)多項工程技術(shù)創(chuàng)新,顯存動態(tài)卸載技術(shù)大幅提升長文本推理并發(fā)、訓(xùn)推共卡協(xié)同實現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理
引擎冬眠機制實現(xiàn)快速拉起和恢復(fù),實現(xiàn)國產(chǎn)算力平臺上高效和穩(wěn)定的強化學(xué)習(xí)訓(xùn)練全流程。
現(xiàn)在,打開訊飛星火網(wǎng)頁端或訊飛星火APP,即可體驗在通用任務(wù)上深度推理和聯(lián)網(wǎng)搜索的全新效果。
同時,星火X1 API也已同步上線訊飛開放平臺,面向廣大開發(fā)者和企業(yè)開放服務(wù)。
星火X1作為首個支持全國產(chǎn)算力的推理大模型,目前微調(diào)服務(wù)已上線訊飛星辰MaaS平臺。
即刻體驗星火X1 API,快來試試吧!
星火X1本次升級后的更多用法,等你探索與分享。
-
科大訊飛
+關(guān)注
關(guān)注
19文章
836瀏覽量
62172 -
大模型
+關(guān)注
關(guān)注
2文章
3020瀏覽量
3810 -
DeepSeek
+關(guān)注
關(guān)注
1文章
772瀏覽量
1317
原文標題:來了!訊飛星火X1全新升級
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論