近期,微軟發布了最新中文曉曉語音升級,中文曉曉新增了 10 種風格。升級后的該語音模型風格多達 14 種,處于行業領先水平。新增風格分別是適用于聊天(Chat)場景的語音,還有平靜(Calm)、開心(cheerful)、悲傷(Sad)、憤怒(Angry)、 恐懼(Fearful)、 不滿(Disgruntled)、 嚴厲(Serious)、撒嬌(Affectionate)、溫柔(Gentle)等。此次,微軟升級的多情感技術,極大豐富了聽眾的收聽體驗,尤其在長文本收聽過程中,可以很大程度緩解聽覺疲勞,提升收聽舒適度。
升級前微軟中文曉曉語音擁有 4 種不同風格,分別是新聞(newscast)、客服(customer service)、助理(assistant)、抒情(lyrical),升級后支持多達 14 種不同風格,能在豐富的情緒和場景中自由轉換,比如多情感有聲讀物、新聞、客服、助理、聊天等。可以滿足不同領域客戶的多樣化定制需求。
IT之家了解到,微軟發布的智能語音合成技術通過應用語音表現力遷移技術,僅利用少量表現力語料數據,便可以訓練出具有高質量、高自然度表現力語音生成能力的源模型。該源模型通過對人類語音表現力特征的深入挖掘,獲取了穩定性高,適應性強的語音情感表征,極大地豐富了合成語音的表現力與可控性,賦予了合成語音擬人的喜怒哀樂,彌補了傳統人工智能語音合成技術中 “人情味”不足的缺憾。
理想的多情感技術將是每個聲音都擁有幾十種甚至上百種豐富細膩的情感表達,可以駕馭不同場景,根據內容表達自動適配情感。
微軟智能語音多情感技術發布,標志了語音合成發展的新趨勢,將成為智能語音應用的 “標準配置”,實現用戶體驗新的突破。
責任編輯:PSY
-
技術
+關注
關注
0文章
432瀏覽量
58766 -
中文
+關注
關注
2文章
62瀏覽量
23609 -
智能語音
+關注
關注
11文章
797瀏覽量
49371
發布評論請先 登錄
藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621
芯資訊|廣州唯創電子WTV系列語音芯片:以技術創新賦能智能語音交互

大模型時代的新燃料:大規模擬真多風格語音合成數據集
智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

普強信息入選2024語音識別技術公司TOP30榜單
基于語音識別的智能會議系統具備哪些交互功能
智能語音的驅動力:揭秘8腳語音芯片在智能設備中的非凡角色
ASR語音識別技術應用
智能密碼、指紋鎖語音芯片ic方案 可存放40s語音內容 NVD語音芯片

評論