近日,階躍星辰在官方公眾號上宣布了一項重大突破——推出Step-1o千億參數(shù)端到端語音大模型。該模型被譽為“國內(nèi)首個千億參數(shù)端到端語音大模型”,標(biāo)志著我國在語音技術(shù)領(lǐng)域取得了新的里程碑。
據(jù)階躍星辰介紹,傳統(tǒng)的語音模型通常采用級聯(lián)方案,即先將用戶輸入的語音信息轉(zhuǎn)化為文本,再進(jìn)行二次轉(zhuǎn)化以生成語音輸出。這種方案不僅過程繁瑣,降低了傳輸效率,而且在轉(zhuǎn)化過程中容易折損掉包括情緒在內(nèi)的關(guān)鍵信息。這導(dǎo)致傳統(tǒng)語音模型存在時延長、反應(yīng)慢、回答質(zhì)量和智能水平不足,以及情感表達(dá)空洞刻板等缺陷。
而階躍星辰推出的Step-1o模型則采用了端到端的語音方案,實現(xiàn)了語音理解和生成的一體化。這一創(chuàng)新設(shè)計不僅提升了模型的智商上限,還使其能夠更好地理解和表達(dá)情感,從而克服了傳統(tǒng)語音模型的諸多缺陷。
Step-1o千億參數(shù)端到端語音大模型的發(fā)布,不僅展示了階躍星辰在語音技術(shù)領(lǐng)域的深厚實力,也為我國語音技術(shù)的發(fā)展注入了新的活力。未來,隨著該模型的不斷優(yōu)化和應(yīng)用推廣,相信將為用戶帶來更加智能、高效和自然的語音交互體驗。
-
語音交互
+關(guān)注
關(guān)注
3文章
306瀏覽量
28570 -
大模型
+關(guān)注
關(guān)注
2文章
3086瀏覽量
3971
發(fā)布評論請先 登錄
德賽西威與面壁智能發(fā)布端側(cè)大模型語音交互方案
一文帶你厘清自動駕駛端到端架構(gòu)差異

自動駕駛中基于規(guī)則的決策和端到端大模型有何區(qū)別?

階躍星辰開源多模態(tài)模型,天數(shù)智芯迅速適配
靈初智能發(fā)布端到端具身模型Psi R0,實現(xiàn)復(fù)雜操作與泛化能力
準(zhǔn)確性超Moshi和GLM-4-Voice,端到端語音雙工模型Freeze-Omni

黑芝麻智能端到端算法參考模型公布

連接視覺語言大模型與端到端自動駕駛

端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

智駕進(jìn)程發(fā)力?小鵬、蔚來端到端模型上車

評論