據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結(jié)果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大模型斬獲國內(nèi)第一梯隊成績。
其中,核心的通用基礎(chǔ)能力與多模態(tài)圖像理解能力上,商湯“日日新”實現(xiàn)雙雙登頂,在16家國產(chǎn)主流大模型中排名第一。
通用基礎(chǔ)能力:三大維度全面領(lǐng)先
此次評測的“通用基礎(chǔ)能力”涵蓋數(shù)理科學(xué)、語言能力和道德風(fēng)險控制三大核心維度。商湯日日新在這三個方面均表現(xiàn)出色,位列第一,得分超越國際均線,展現(xiàn)出多維度的綜合優(yōu)勢。
數(shù)理科學(xué)能力方面,商湯日日新以 88 分的高分位列第二,在數(shù)學(xué)推理、代碼編寫、科學(xué)常識等細(xì)分領(lǐng)域,展現(xiàn)出極強的邏輯推理和計算能力。報告特別指出,邏輯推理和數(shù)學(xué)能力已成為衡量大模型實力的關(guān)鍵分水嶺。而商湯在這方面的優(yōu)勢尤為顯著。
語言能力方面,在意圖理解、角色扮演、開放式推理等方面表現(xiàn)優(yōu)異,尤其是在語境適應(yīng)性、指令遵循及輸出穩(wěn)定性上表現(xiàn)出色,確保了生成內(nèi)容的準(zhǔn)確性和一致性。
道德責(zé)任能力方面,以 75.88 分的成績位居榜首,在風(fēng)險信息識別、偏見控制等方面表現(xiàn)突出,充分體現(xiàn)了商湯在倫理安全與風(fēng)險控制上的嚴(yán)格標(biāo)準(zhǔn)。
多模態(tài)能力:圖像理解與生成雙突破
在多模態(tài)能力評測中,商湯日日新同樣表現(xiàn)亮眼。在多模態(tài)圖像理解能力評測中,商湯日日新以 84.05的高分位居榜首,在文字識別、物體定位、圖像風(fēng)格識別、圖片邏輯理解等九個細(xì)分維度中奪得三項第一,顯示出強大的圖像理解能力。
其中,文字識別能力在復(fù)雜背景和低質(zhì)量圖像中表現(xiàn)遠(yuǎn)超中國及國際行業(yè)平均水平;物體定位能力精準(zhǔn)度國內(nèi)領(lǐng)先;圖像風(fēng)格識別準(zhǔn)確率顯著高于中國大模型均線。
在多模態(tài)生成能力評測中,商湯秒畫在商業(yè)型和藝術(shù)型圖像生成方面表現(xiàn)優(yōu)異,尤其是在商業(yè)圖像生成中,圖像質(zhì)量、指令遵循和風(fēng)格多樣性得分領(lǐng)先,展現(xiàn)出強大的技術(shù)實力和應(yīng)用潛力,能夠很好地滿足廣告、電商等商業(yè)場景的需求。
專業(yè)應(yīng)用能力:多行業(yè)場景表現(xiàn)優(yōu)異
在專業(yè)應(yīng)用能力評測中,商湯日日新同樣處于第一梯隊,位居前二。其綜合能力涵蓋 AI 智能體、專業(yè)文本處理及超長文本處理,展現(xiàn)出在復(fù)雜決策、專業(yè)知識理解與長文本推理方面的強大能力。
在行業(yè)應(yīng)用能力方面,商湯日日新在金融、醫(yī)療、政務(wù)、教育等 14 個行業(yè)場景中均表現(xiàn)優(yōu)異,體現(xiàn)了其對不同領(lǐng)域知識的深度理解和應(yīng)用能力,以及強大的行業(yè)適配性和落地能力。
自 2023 年 4 月首次發(fā)布以來,日日新 SenseNova 大模型體系已進(jìn)行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行業(yè)內(nèi)率先實現(xiàn)了原生融合模態(tài)訓(xùn)練的突破,打破了大語言與多模態(tài)分立的局面,支持文本、圖像、視頻、語音等多源異構(gòu)信息的綜合處理,為多場景應(yīng)用奠定了堅實基礎(chǔ),推動了AI大模型的工業(yè)化發(fā)展。
-
AI
+關(guān)注
關(guān)注
87文章
34146瀏覽量
275287 -
商湯科技
+關(guān)注
關(guān)注
8文章
552瀏覽量
36642 -
大模型
+關(guān)注
關(guān)注
2文章
3020瀏覽量
3806
原文標(biāo)題:大語言通用能力第一!多模態(tài)圖像理解能力第一!
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內(nèi)榜首,一個全球第一

商湯科技日日新大模型SenseNova上線聲網(wǎng)云市場
商湯“日日新”融合大模型榮獲雙料冠軍
商湯科技推出“日日新”融合大模型
商湯日日新多模態(tài)大模型權(quán)威評測第一
商湯Sensechat向香港用戶免費開放
商湯日日新大模型中標(biāo)上海電信訂單
商湯AI大模型與中國國家籃球隊達(dá)成戰(zhàn)略合作
商湯科技推出SenseFoundry-VL方舟多模態(tài)新智平臺

評論