12款主流大模型,行業(yè)研報撰寫能力哪家強?
權(quán)威研究機構(gòu)弗若斯特沙利文(Frost & Sullivan)聯(lián)合頭豹研究院最新發(fā)布的《2023年中國大模型行研能力評測報告》給出評價結(jié)論。
商湯語言大模型“日日新·商量”以總分7.73(滿分10分)斬獲總榜第一,并在報告撰寫能力(八大模塊)、模型基礎(chǔ)能力(行研基礎(chǔ)能力)兩個子榜位居第一。
報告中,沙利文這樣評價“商湯商量”:在語言、知識、理解、推理和學(xué)科五大能力上均處于行業(yè)領(lǐng)先水平,不僅可以處理各類文本和信息,還能在協(xié)助行業(yè)分析師工作時,充分勝任隨身綜合知識庫、高效文本編輯器、數(shù)理計算器和簡單易用的編程助手等多個角色。
大語言模型為行研數(shù)字化“加料”
“商湯商量”強化分析師生產(chǎn)力
行業(yè)研究是通過分析特定行業(yè)的定義、競爭格局、市場規(guī)模等關(guān)鍵方面,產(chǎn)出深刻洞察和觀點。《2023年中國大模型行研能力評測報告》主要從研究報告撰寫能力、模型基礎(chǔ)能力、行業(yè)綜合理解能力三大方向?qū)Υ竽P瓦M行全方位評測。 研究報告撰寫子榜單方面,此前沙利文及頭豹行企研究用于行業(yè)深入分析的是一套全面系統(tǒng)的8-D研究方法論。
在這一框架下,沙利文調(diào)集百人規(guī)模的分析師團隊精細(xì)研磨一套專業(yè)的8D模塊提問方法,對模型能力進行評測,“商湯商量”在報告撰寫能力的子榜單位居第一。
沙利文認(rèn)為,大模型報告撰寫能力綜合熱力矩陣圖顯示,“商湯商量”是綜合能力最強的模型,且在各個板塊表現(xiàn)處于前列,能力均衡。
另外,在模型基礎(chǔ)能力(行研基礎(chǔ)能力)子榜中,“商湯商量”同樣奪魁,在語境轉(zhuǎn)換、文字生成、知識儲備等模塊排名第一。
分析師認(rèn)為,“商湯商量”產(chǎn)出的內(nèi)容能夠避免使用非專業(yè)詞匯,同時確保生成內(nèi)容的完整性和專業(yè)性,為用戶提供閱讀體驗感滿意的研究產(chǎn)出物。
目前,行業(yè)研究工作存在諸多痛點。從基礎(chǔ)數(shù)據(jù)收集到深度分析輸出,傳統(tǒng)行業(yè)研究流程面臨著工具革新滯后、團隊知識難傳承、信息溯源復(fù)雜等挑戰(zhàn)。
結(jié)合大模型技術(shù),可協(xié)助分析師克服傳統(tǒng)行業(yè)研究的核心制約因素,通過AI專家訪談、AI內(nèi)容生成、AI文字校對、AI資料檢索等多方面賦能行研,顯著提升研究精度和效率,推動行研數(shù)字化進程。
審核編輯:湯梓紅
-
AI
+關(guān)注
關(guān)注
87文章
34223瀏覽量
275369 -
商湯
+關(guān)注
關(guān)注
0文章
61瀏覽量
4084 -
大模型
+關(guān)注
關(guān)注
2文章
3027瀏覽量
3827
原文標(biāo)題:沙利文《2023中國大模型行研能力評測報告》:12款主流大模型,商湯日日新·商量總榜第一
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
FRED應(yīng)用:數(shù)字化極坐標(biāo)數(shù)據(jù)取樣
羅克韋爾推動軌交裝備制造業(yè)數(shù)字化轉(zhuǎn)型
越南副總理一行到訪商湯科技
研華與昆山數(shù)字化創(chuàng)新協(xié)會聯(lián)合舉辦AI Agent專題論壇
研華如何推動工業(yè)領(lǐng)域數(shù)字化轉(zhuǎn)型
開源技術(shù)推動教育數(shù)字化高質(zhì)量發(fā)展
高通與谷歌達(dá)成戰(zhàn)略合作,推動汽車行業(yè)數(shù)字化轉(zhuǎn)型
高速數(shù)字化儀的技術(shù)原理和應(yīng)用場景
推動TPM成功數(shù)字化的關(guān)鍵是什么
研華數(shù)字化港口論壇圓滿落幕
商湯日日新·商量-擬人大模型帶你對話未來,感受真實
商湯Sensechat向香港用戶免費開放
RFID技術(shù)如何推動企業(yè)資產(chǎn)管理數(shù)字化
網(wǎng)關(guān)與IO模塊:產(chǎn)業(yè)數(shù)字化與智能化的關(guān)鍵推動力

評論