近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態大模型首輪評估。
商湯日日新SenseNova融合模態大模型在所有模型中,獲得當前最高評級——4+級,并成為國內首家獲得最高評級的大模型。
可信AI多模態大模型評估2025年1月啟動,由中國信通院人工智能研究所牽頭,依據由業界60余家單位共同編制的《多模態大模型技術要求和評估方法》標準開展,是國內最影響力和權威的多模態大模型測評之一。
評估包含基礎能力、理解能力、生成能力、專項測試四個模塊,共計2個能力域,30余個能力項,為多模態大模型的技術研發、應用落地等方面提供規范與指導。
結果顯示,在基礎能力方面,商湯日日新融合模態大模型在多模態融合、多模態轉換、跨模態感知、跨模態理解、跨模態生成能力項中表現優異,具備扎實的技術能力。
在模型應用方面,商湯日日新融合模態大模型在行業覆蓋度、場景支持度、應用形態多樣性、易用性能力項中表現優異,具備穩健的應用能力。
早在今年1 月,商湯科技推出日日新融合大模型,在行業率先實現原生融合模態,引領了大語言模型和多模態大模型的一統化大潮。
今年4月,商湯升級日日新SenseNova V6版本,通過多模態長思維鏈訓練、全局記憶、強化學習等關鍵技術,實現多模態推理能力突破。由此商湯日日新V6可自然融合文本、圖像、視頻、語音等多形態信息,解決復雜場景下的綜合問題。
例如,在實時音視頻交互方面,商湯日日新V6擁有強大的實時交互、視覺識別、記憶思考、持續對話和復雜推理等能力,能幫助AI與人類更自然、更流暢地交流,帶來創新人機交互體驗。在視頻生成方面,商湯日日新V6具備多模態視頻解析能力,支持10分鐘級視頻全幀率解析,并可根據解析內容產出新的視頻內容。
目前,商湯日日新大模型已在教育、金融、工業等多個領域實現場景落地。此次首批通過可信AI多模態大模型評估并獲最高評級認證,意味著商湯日日新不僅已具備行業領先的多模態推理能力,還能很好地滿足各行各業真實場景中對模型通用性、泛化性和專業性的嚴格要求,為行業可信發展提供堅實基礎。
-
商湯科技
+關注
關注
8文章
555瀏覽量
36672 -
大模型
+關注
關注
2文章
3039瀏覽量
3854 -
AI大模型
+關注
關注
0文章
367瀏覽量
509
原文標題:國內首家!最高評級!
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內榜首,一個全球第一

評論