日前,商湯科技日日新大模型SenseNova即將正式上線聲網(wǎng)云市場,開發(fā)者和企業(yè)用戶可通過聲網(wǎng)的實時互動云服務(wù)進行調(diào)用,將商湯領(lǐng)先的模型能力集成到各類應(yīng)用場景中,快速構(gòu)建基于日日新大模型的實時音視頻對話產(chǎn)品和應(yīng)用,實現(xiàn)穩(wěn)定、流暢、無延遲的音視頻對話體驗。
打造穩(wěn)定、實時、極低延遲的實時音視頻對話體驗
2024年7月,商湯科技推出了國內(nèi)首個具備實時音視頻交互大模型。今年,全新升級的日日新大模型SenseNova,擁有更加強大的實時交互、視覺識別、記憶思考、持續(xù)對話、復(fù)雜推理,以及情緒感知和表達等能力,還可隨時打斷,讓人機對話擺脫一問一答的刻板模式,互動體驗更自然、更流暢、更絲滑。
在今年1月實時音視頻中文測評基準 SuperCLUE-Live 中,商湯日日新大模型以總分 68.59 位列國內(nèi)首位,展現(xiàn)了強大的多模態(tài)信息感知和理解及記憶能力。
在實時音視頻交互場景中,對話響應(yīng)速度、語音清晰度等是衡量模型能力和產(chǎn)品體驗的重要指標。在級聯(lián)方案中,聲網(wǎng)已經(jīng)將端到端延時降低到650ms。
商湯基于日日新大模型SenseNova的多模態(tài)推理與交互能力,結(jié)合聲網(wǎng)領(lǐng)先的產(chǎn)品優(yōu)勢,更實現(xiàn)了500ms的端到端超低傳輸延時,與人類日常對話交互極為接近。同時,還可支持全雙工通信,在弱網(wǎng)環(huán)境下也可有效保障傳輸質(zhì)量,并可智能消除對話中的噪聲、回聲、背景人聲,做到精準的人聲識別,讓人與AI的交互自然流暢。
合作賦能用戶,解鎖更多應(yīng)用新場景
商湯日日新大模型SenseNova與聲網(wǎng)實時互動云服務(wù)的結(jié)合,有望打開更多人機交互場景,滿足兒童陪伴、同聲傳譯、視頻面試、電話客服、口語陪練、心理療愈、虛擬主播、個人助理等多元化場景的用戶需求,拓展大模型的落地與應(yīng)用寬度。
此外,商湯科技與聲網(wǎng)還將攜手通過開放社區(qū) RTE開發(fā)者社區(qū),向有潛力的個人開發(fā)者及中小企業(yè)開放商湯日日新的深度體驗,旨在持續(xù)擴大生態(tài)伙伴體系,并為開發(fā)者提供豐富的資源和平臺支持。目前,雙方已與40家中小企業(yè)達成深度體驗合作,共同探索大模型在實時音視頻交互領(lǐng)域的更多應(yīng)用潛能。
自2018年以來,商湯科技與聲網(wǎng)一直保持著緊密合作,在數(shù)字人、美顏特效、人力資源大模型等場景為不同行業(yè)客戶提供多種、差異化的產(chǎn)品和服務(wù)。未來,雙方還將繼續(xù)合作拓展日日新大模型的應(yīng)用場景,共同將中國原創(chuàng)AI技術(shù)推向全球。
-
音視頻
+關(guān)注
關(guān)注
4文章
518瀏覽量
30357 -
商湯科技
+關(guān)注
關(guān)注
8文章
552瀏覽量
36643 -
大模型
+關(guān)注
關(guān)注
2文章
3020瀏覽量
3806
原文標題:商湯日日新上線聲網(wǎng)云市場,與四十家企業(yè)開啟合作
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內(nèi)榜首,一個全球第一

評論