女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

20多年專注語音合成芯片公司分享:TTS芯片端是如何達到100%精準合成的

智能語音 ? 來源:智能語音 ? 作者:智能語音 ? 2024-05-06 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我國漢字文化博大精深,雖然現在語音合成技術發展較為成熟,但仍無法做到100%的智能分析和識別,來滿足人們的需求習慣。
例如漢字“一”,在不同語境下有3種讀法,“一五一十”“一路平安”“一言為定”,大家可以讀讀看。
再例如數字“1”,電話號碼“010-62986600、15321801789”,日期“2018-01-01”,在電話號碼中大家習慣讀成“幺”,而在日期里又習慣性的讀成“一”。
這樣的場景還有很多很多,本文將向大家介紹在TTS芯片端,如遇到無法智能識別播報的情況下,利用“文本控制標記”,使文本合成準確率達到100%的。
我們以市場常見的TTS語音芯片VTX316為例,它支持10多種文本控制標記,下面我們一一列舉,并加以說明。
控制標記統一格式為“[XX]”,“XX”=標記參數,使用時只要將標記放在需要調整的文本前即可。

1. 數字處理標記[nX]

默認設置下芯片會自動識別數字的含義,是按“號碼方式" OR "數值方式"進行解讀
備注:“X”=0、1、2
[n0]=自動判斷
[n1]=按號碼方式
[n2]=按數值方式
舉例文本1:撥打62986600。有123公斤重。
說明:“62986600”會讀作“六二九八六六零零”。“123”讀作“一百二十三”
舉例文本2:[n2]撥打62986600。[n1]有123公斤重。
說明:“62986600”會讀作“六千二百九十八萬六千六百”。“123”讀作“一二三”

2. 數字“1”的處理標記[yX]

默認設置下芯片會自動識別數字"1"的讀法,是讀“幺" OR "一"進行解讀
備注:“X”=0、1
[y0]=讀成“幺”
[y1]=讀成“一”
舉例文本1:[y0]撥打010-62986600
說明:讀作“撥打零幺零,六二九八六六零零”
舉例文本2:[y1]撥打010-62986600
說明:讀作“撥打零一零,六二九八六六零零”

3. 標點符號處理標記[bX]

默認情況下標點符號的名稱是不進行播報的
備注:“X”=0、1
[b0]=不播報標點符號
[b1]=播報標點符號
舉例文本:[b1]歡迎光臨,請進!
說明:讀作“歡迎光臨 逗號 請進 感嘆號”

4. 改變漢字讀音標記[=X]

當我們想改變原來漢字的讀音時可以用到這個標記策略,比如更換一個字的發音或是多音字”
備注:“X”=要改變的讀音,格式為“漢語拼音”+“聲調”,聲調=1、2、3、4、5(輕聲)
舉例文本1:歡迎他們,歡迎他[=ni3]們,歡迎他[=wo3]們
說明:讀作“歡迎他們,歡迎你們,歡迎我們”
舉例文本2:解[=xie4]放濤用語音合成芯片,單位的單[=shan4]小虎也在用
說明:“解”會讀成“謝”,“單”會讀成“善”

5. 發音人設置標記[mX]

VTX316TTS芯片支持8種發音人(音色),可通過[mX]標記隨意切換。
備注:“X”=3、51、52、53、54、55、56、57,對應的發音人如下
[m3]=曉玲,女聲(默認設置)
[m51]=尹小堅,男聲
[m52]=易小強,男聲
[m53]=田蓓蓓,女聲
[m54]=唐老鴨,卡通聲
[m55]=小燕子,女童聲
[m56]=貝童,男童聲
[m57]=曉可,男童聲
舉例文本:[m3]你好,[m54]這是發音人設置的舉例。
說明:“你好”的發音人為女聲曉玲,“這是發音人設置的舉例”的發音人是卡通聲唐老鴨

6. 語速調節標記[sX]

TTS芯片支持30級語速調節
備注:“X”=0~30,默認設置為5,數值越大語速越快
舉例文本:歡迎使用[s10]宇音天下語音合成芯片
說明:“歡迎使用”的語速為5級,“宇音天下語音合成芯片”的語速為10級

7. 語調調節標記[tX]

語音合成芯片可控制10級語調調整
備注:“X”=0~10,數值越大語調越高
舉例文本:歡迎使用[t8]宇音天下語音合成芯片
說明:“歡迎使用”的語調為5級,“宇音天下語音合成芯片”的語調為8級

8. 音量調節標記[vX]

TTS語音芯片支持10級音量調整
備注:“X”=0~10,數值越大音量越大
舉例文本:歡迎使用[v8]宇音天下語音合成芯片
說明:“歡迎使用”的音量為5級,“宇音天下語音合成芯片”的音量為8級

9. 提示音處理標記[xX]

語音合成芯片通常內置多首提示音,例如"sound901",具體格式參芯片數據手冊。
備注:"X"=0、1
[x0]=不按提示音處理
[x1]=按提示音處理
舉例文本:[x0]sound901
說明:讀作“sound901”,會按照字母加數字的讀法播報

10. 中文拼音識別標記[iX]

判斷是否將文本識別成拼音
備注:“X”=0、1
[x0]=不識別漢語拼音
[x1]=識別成拼音
舉例文本:[i1]歡迎shi3yong4宇yin1tian1xia4[i0]語音合cheng2系統
說明:讀作“歡迎使用宇音天下語音合cheng2系統”,“cheng2”會按照字母和數字逐字播報

11. 停頓(靜音)時間標記[pX]

在有需要停頓的文本中插入該標記,可靈活控制停頓時間
備注:“X”=停頓時間,單位毫秒(ms)
舉例文本:歡迎使用[p800]宇音天下[p350]TTS語音芯片
說明:播報“歡迎使用”后,停頓800毫秒,播報“宇音天下”,停頓350毫秒,播報“TTS語音芯片”

12. 恢復默認合成參數標記[d]

本參數標記將合成參數恢復成默認設置,除發音人標記參數
舉例文本:[n1]123,[y1]010-62986600[d]123, 010-62986600
說明:讀作“一二三,零一零,六二九八六六零零,一百二十三,零幺零,六二九八六六零零”

經過上面的介紹,在語音合成芯片端如何達到100%的準確率,各位的思路是否已經非常清晰了呢?

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    460

    文章

    52520

    瀏覽量

    441013
  • TTS
    TTS
    +關注

    關注

    0

    文章

    53

    瀏覽量

    11179
  • 語音合成芯片

    關注

    0

    文章

    27

    瀏覽量

    7663
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Air8000 TTS開源,語音合成從此“零距離”!

    技術不應有圍墻,創新需要共生長。Air8000宣布TTS應用源代碼全面開放,開發者可自由定制語音風格、優化合成效果,讓文字與聲音的對話,不再受限于黑箱算法。 TTS (Text-to-
    的頭像 發表于 07-03 16:33 ?206次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b><b class='flag-5'>合成</b>從此“零距離”!

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    一、行業應用背景在零售業態智能化轉型的浪潮中,收銀設備正經歷從功能型向服務型轉變的關鍵階段。WT3000T8語音合成芯片應運而生,專為滿足新零售場景下智能收銀終端的語音交互需求而設計。
    的頭像 發表于 04-24 08:45 ?276次閱讀
    智能收銀<b class='flag-5'>語音</b>交互新標桿—WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>技術應用解析

    WT3000TX語音合成芯片介紹V1

    WT3000TX是一系列功能強大的高品質語音芯片,采用了高性能32位處理器、最高頻率可達240MHz。WT3000TX高集成度的語音合成芯片
    發表于 04-17 08:43 ?0次下載

    芯資訊|WT3000T8語音合成芯片TTS在智能收款機中的創新應用設計方案介紹

    體驗的關鍵模塊。廠家廣州唯創電子推出的WT3000T8作為新一代高性能語音合成芯片,憑借其優異的處理能力和靈活的功能配置,正在為收款機智能化升級提供核心技術支持。
    的頭像 發表于 04-15 08:55 ?330次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>在智能收款機中的創新應用設計方案介紹

    YX5p多功能單芯片CMOS語音合成4位微控制器中文手冊

    深圳市駿旺微電子有限公司的 YX5P 系列語音芯片數據手冊,詳細介紹了芯片的各項特性、功能、應用及相關參數,為使用者提供全面的技術參考。?產品概述:YX5P 系列是多功能單
    發表于 04-03 11:18 ?0次下載

    【CW32模塊使用】語音合成播報模塊

    SYN6288E 中文語音合成芯片是北京宇音天下科技有限公司在 2010 年初推出的一款性/價比更高的 SYN6288 芯片的基礎上更改封裝
    的頭像 發表于 03-29 17:25 ?641次閱讀
    【CW32模塊使用】<b class='flag-5'>語音</b><b class='flag-5'>合成</b>播報模塊

    芯資訊|WT3000T8語音合成芯片:高性價比語音交互解決方案

    在智能終端設備快速普及的當下,語音交互已成為提升用戶體驗的關鍵功能。廣州唯創電子推出的WT3000T8語音合成芯片,憑借其卓越的語音處理能力
    的頭像 發表于 03-24 09:05 ?428次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:高性價比<b class='flag-5'>語音</b>交互解決方案

    芯知識|WT3000T8語音合成芯片:功能解析與應用指南

    在人工智能與物聯網技術蓬勃發展的今天,語音交互已成為智能設備的重要功能。廣州唯創電子推出的WT3000T8語音合成芯片憑借其高性能、低功耗和靈活的控制方式,廣泛應用于智能家居、工業設備
    的頭像 發表于 03-24 08:42 ?414次閱讀
    芯知識|WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:功能解析與應用指南

    WT3000T8-32N語音合成TTS芯片:小體積、強性能,重塑智能語音交互體驗

    在萬物互聯的智能化浪潮中,語音交互已成為人機交互的核心入口。廣州唯創電子推出的WT3000T8-32N語音合成芯片,憑借其4×4mm超小封裝、240MHz超強算力與多場景
    的頭像 發表于 03-21 09:20 ?423次閱讀
    WT3000T8-32N<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>:小體積、強性能,重塑智能<b class='flag-5'>語音</b>交互體驗

    在線VS離線TTS語音合成芯片)有哪些優勢-AIOT智能語音產品方案

    離線 TTS 存在語音質量欠佳、音色選擇有限、語言支持單一更新困難、占用資源多、適應性差、難以個性化定制等痛點 01更新維護困難 由于是離線模式,難以及時獲取最新的語音數據和算法更新
    的頭像 發表于 02-25 17:08 ?401次閱讀
    在線VS離線<b class='flag-5'>TTS</b>(<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>)有哪些優勢-AIOT智能<b class='flag-5'>語音</b>產品方案

    智能語音的驅動力:揭秘8腳語音芯片在智能設備中的非凡角色

    語音技術滲透生活,8腳語音芯片以微縮體積、低功耗、卓越性能成智能設備語音功能核心,集成識別、合成、壓縮解碼等功能,實現
    的頭像 發表于 12-02 14:23 ?530次閱讀

    人員定位工牌卡-TTS語音合成文字轉語音芯片WT3000T8應用方案解析

    提高員工的工作效率和安全性。本文將詳細介紹一種基于WT3000T8-32在線TTS芯片的方案,探討其在人員定位工牌卡中的應用、市場潛力、功能特點和方案優勢。
    的頭像 發表于 11-27 15:51 ?509次閱讀

    九芯語音合成芯片NVH-FLASH,看這一篇足矣!

    前言什么是語音合成芯片:簡而言之,就是將文字信息轉化為語音信號輸出的電子器件。它能夠將存儲或接收到的文字內容,通過內部復雜的算法處理,轉換成自然流暢的
    的頭像 發表于 11-21 01:01 ?636次閱讀
    九芯<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>NVH-FLASH,看這一篇足矣!

    視頻時鐘合成芯片怎么用

    視頻時鐘合成芯片(Video Clock Synthesizer,VCS)是一種用于生成和調整視頻信號時鐘的電子設備,廣泛應用于視頻處理、顯示、傳輸等領域。它能夠將輸入的時鐘信號轉換成所需的視頻格式
    的頭像 發表于 10-10 11:17 ?735次閱讀

    WT2605C TTS在線語音合成芯片:賦能多行業領域,引領產品智能化

    作為一款集成了在線TTS功能的藍牙語音芯片,憑借其卓越的性能和廣泛的應用領域,正引領著智能語音技術的新風尚。
    的頭像 發表于 09-12 15:54 ?631次閱讀
    WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:賦能多行業領域,引領產品智能化