當前,隨著智能語音技術日益成熟,越來越多的互聯網巨頭、傳統終端制造廠商以及初創公司進軍智能語音領域,新產品、新技術不斷涌現,智能語音產業進入快速發展階段。本報告重點對智能語音產業生態、產業發展前景、行業痛點等進行了全面梳理,并結合我市智能語音產業發展提出有關建議。
智能語音產業概述
智能語音產業結構分為三層,上游基礎層包括芯片、模組、傳感器以及云計算服務和大數據平臺等;中游技術層主要提供語音識別、語音合成、深度/機器學習、人機交互等技術研究和服務;下游應用包括智能手機、智能家居、智能汽車、可穿戴設備、虛擬助力、家庭機器人等B2C應用,以及金融、教育、醫療、安防等B2B應用。
圖1 智能語音產業架構
智能語音產業概述
(一)谷歌
谷歌一直致力于語音交互市場,2011年已收購語音通信技術公司SayNow、語音合成技術Phonetic Arts等技術公司,2014年收購了SR Tech Group的多項語音識別相關的專利。2016年,谷歌開放了語音識別API,即谷歌語音搜索和語音輸入的支持技術,包括80多種語言,適用于各種實時語音識別與翻譯應用。2017年,谷歌發布了用于語音交互的Actions on Google平臺,可支持所有Google Assistant所支持的平臺,并在功能方面允許用戶通過語音完成交易。
谷歌作為全球知名互聯網巨頭,依托已有的產品基礎,將語音交互技術融入到搜索、地圖、智能家居、機器人等產品中,構建一個新的應用平臺。目前,谷歌語音助手已接入全球智能手機、汽車與智能家庭設備等產品達5億臺以上,進入了80多個國家與地區。根據Capvision統計數據顯示,谷歌占據全球智能語音市場28.4%的份額,位居全球第二。
(二)科大訊飛
科大訊飛是從事智能語音技術、人工智能技術研究、軟件及芯片產品開發、語音信息服務及電子政務系統集成的國家級重點軟件企業和創新型企業,擁有語音及語言信息處理國家工程實驗室、國家級企業技術中心、國家博士后科研工作站等榮譽稱號??拼笥嶏w是我國智能語音與人工智能產業的龍頭企業之一,在語音合成、語音識別、口語評測、自然語言處理等多項技術擁有國際領先的成果,其產品占據中文語音識別服務市場70%的份額,在專業領域的應用更是占到80%的市場份額。
在業務布局方面,科大訊飛持續推進“平臺+賽道”的人工智能戰略,推出了國內首個以智能語音和人機交互為核心的人工智能開放平臺,為移動互聯網、智能硬件的廣大創業開發者和海量用戶提供人工智能開發與服務能力,圍繞人工智能開放平臺積極構建產業生態。在“賽道”上,把握垂直入口或行業的剛需,在教育、政法、智能汽車等領域實現了規模應用。2018年,科大訊飛實現營業收入79.17億元,同比增長45.41%,凈利潤達5.42億元。
(三)思必馳
思必馳是國內擁有全套語音類知識產權的公司,在語音識別、語義理解、聲紋識別、對話管理、音頻分析等方面均有深厚技術積累,是國際上極少數擁有自主產權、中英文綜合語音技術的公司之一。2017年9月,思必馳對外發布了DUI語音交互開放平臺,把語音相關技術整合成AIOS人機對話操作系統,作為安卓系統之上的一層標準接口,提供給硬件合作伙伴。同時針對不同場景,AIOS分成了不同版本,針對車載、家居、機器人等產品做垂直領域下的對話式交互。
在產業生態構建上,思必馳主要依托自身語音交互技術優勢,面向車載、家居、機器人等垂直領域,為互聯網企業、智能硬件企業提供語音交互技術解決方案。其中,在車載方向,思必馳在車載后裝市場占有率已達到行業第一,并逐步向前裝市場延伸,與一汽、長城、大眾、海馬、小鵬汽車等十余個車廠企業建立合作關系;在智能家居方向,思必馳的技術被應用于貓精靈X1/M1、騰訊聽聽、小米小愛同學、聯想智能音箱等多款知名產品,在音箱市場占有率行業第一;在家用機器人、兒童故事機等領域,思必馳已與浙江大華、步步高等企業建立合作關系。同時,思必馳通過DUI開放平臺,面向開發者提供完整的智能對話交互方案,支持快速自定義開發,打造開放的生態圈。
(四)聲智科技
聲智科技成立于2016年5月,是全球領先的遠場智能交互系統提供商之一,主要面向智能家居、智能汽車、智能會議、智能安防、智能金融、智能教育、智能醫療、智能法院、智能交通和機器人等行業領域,為客戶提供麥克風陣列芯片與模組以及智能網關/機頂盒、智能電視、智能車機、智能手機、智能玩具等技術解決方案。
在產業生態構建方面,聲智科技主要依托自身遠場交互技術,為互聯網企業、智能硬件等客戶提供應用解決方案,同時發布了AZERO遠程智能交互平臺,連接相關智能終端產品,為終端客戶提供更多的功能服務。目前聲智科技已與小米、百度、阿里、華為、騰訊、中國移動、聯想、創維、金蝶、浪潮、國美等龍頭企業建立合作關系,小易精靈帶屏智能音箱、百度小度智能音箱、華為AI音箱、聯想MINI智能音箱、國美智能音箱GOMEPOD等產品均使用了聲智科技遠場語音交互方案。
智能語音產業發展前景
(一)市場需求助力產業拓展
5G通信技術高速率、大帶寬、低時延、高可靠、海量連接的特性加速了“萬物互聯”時代發展,有效激發了智能語音進入更多應用場景,為語音識別與語義識別提供更大的數據量和更有利的數據環境,從而橫向衍生出更豐富的功能和產品。智能語音應用在智能手機、平板電腦等移動智能終端的普及,移動互聯網用戶中使用智能語音的數量正大幅增長。在金融、電信、教育、醫療、軌道交通等垂直領域,智能語音技術和產品的應用正快速發展,實現從輔助技術手段向關鍵應用的發展。智能語音產業規模持續快速增長,預測2019年國內智能語音市場規模破2000億元大關。
(二)政策利好推動行業發展
我國利好政策持續推動智能語音行業的發展。早在2017年11月5日,科技部召開《新一輪人工智能發展規劃》暨重大科技項目啟動會,會上宣布了首批四家國家新一代人工智能開放創新平臺名單,明確依托科大訊飛建設智能語音國家新一代人工智能開放創新平臺。2018年3月5日,國務院總理***在十三屆全國人大一次會議政府工作報告時表示,要加強新一代人工智能研發應用,在醫療、養老、教育、文化、體育等多領域推進“互聯網+”, “人工智能”再次被寫入政府工作報告。隨著人工智能上升到國家戰略地位,智能語音作為其基礎,未來發展也將受益。
(三)智能家居場景帶來機遇
2018年全球智能家居市場出貨量約為6.56億臺,其中,中國市場累計出貨近1.5億臺,同比增長36.7%。智能音箱等單品的爆發、語音交互的普及以及智能平臺的崛起,將促使消費者購買更多的智能家居設備,智能家居產品和服務可用性也會明顯增加,全球智能家居市場將持續快速增長。在人工智能快速發展的環境下,語音已經成為智能家居產品的重要環節。2018年,中國智能家居設備市場語音助手搭載率達到28.6%,同比增長177.6%。
(四)科技巨頭紛紛開展布局
在語音生態方面,百度宣布語音識別技術及能力全面開放。騰訊、搜狗語音開放平臺相繼上線。在語音技術應用方面,各大廠商對家居、車載、可穿戴等環節的關注明顯升溫。智能家居領域,百度發布了Baiduihome,阿里聯合智能家電廠商推出天貓魔盒,搜狗聯手魅族發布了魅族電視盒子。智能車載領域,百度分別推出了手機智能互聯產品Carlife、私有云服務平臺MyCar和智能行車助手CoDriver。阿里云和上汽合作推出車載操作系統,騰訊發布了路寶App+路寶盒子,可與騰訊云連接,以實現車輛診斷、油耗分析、車友社交等功能。搜狗則和四維圖新合作,推出飛歌導航??纱┐黝I域,百度采取扶持外部產品,內置百度服務,形成開放生態思路,分別推出inside智能硬件平臺、基于健康云的Dulife智能健康平臺等應用,以吸引硬件廠商加入。
智能語音行業發展痛點(一)人才欠缺,創新成效低
智能語音和人工智能技術產業化趨勢愈發明顯,國內外知名IT企業紛紛加大對智能語音業務的投入,不僅加劇了語音技術的國際競爭,也增大了語音技術人才需求缺口。在風險投資的追捧下,人工智能領域高端人才離職創業數量增多,近年來微軟、百度、阿里、騰訊、IBM、英特爾中國等都出現了研究院院長等核心人才離職創業的現象。同時由于國內智能語音及人工智能行業的特殊性、高水平科研人才的稀缺性以及人才培養的滯后性,智能語音和人工智能人才將面臨持續短缺,吸引和培養高水平人才隊伍的力度不足,智能語音行業今后發展存在潛在風險。
(二)重點關鍵技術有待突破
從智能語音技術發展來看,當前語音合成技術已經較為成熟,合成清晰度和自然度已經達到較高水平,但是語音識別技術仍有許多需要提升的技術難點。目前大部分語音識別的研究和應用,主要是基于英語、漢語、阿拉伯語和法語等大語種,而世界上一共有6900多種語言,快速實現一套基于任何語言的語言識別系統是非常困難的。
(三)語音交互平臺“各自為政”
目前各個語音交互開放平臺各自為政,相關真實數據訓練彼此分散,在語義理解和圖譜識別等認知技術方面也尚未形成通用的技術框架,智能手機、智能可穿戴設備、智能音箱、智能電視等不同產品類型、不同品牌間語音交互技術不統一,影響用戶使用體驗,不利于構建融合、開放的智能終端應用生態,制約語音交互市場和產業發展。
我市智能語音發展建議
(一)構建產業生態圈
加快推進智能語音應用平臺布局,引導和支持已落戶的科大訊飛聯合百度、騰訊、思必馳等智能語音公司,在渝搭建開放共享平臺,統一開發者和用戶入口,為智能音箱、智能家電、智能可穿戴設備等不同類型、不同品牌的智能產品用戶提供統一的平臺入口和功能服務,構建智能應用生態圈。鼓勵歐珀、維沃、傳音、美的、海爾等本地智能手機廠商、智能家電廠商加強與統一開放平臺的合作,植入智能語音技術與服務,推進產品提檔升級。
(二)加強公共平臺建設
整合大數據資源,建立支持智能語音產業發展的基礎數據,引導建設基于語音的海量訓練資源庫和標準測試數據集。通過新建或協議使用等方式,引導建設滿足深度學習等智能計算需求的國家超級計算中心、新型計算集群共享平臺、云端智能分析處理服務系統、智能系統安全服務平臺等基礎資源平臺,降低人工智能創新成本。鼓勵和支持現有眾創空間等創新孵化平臺加大對智能語音項目的培育。
(三)加強技術創新
研究制定專項政策,下大力引進培育5G、智能語音等關鍵技術研究、產品開發、應用創新等方面的人才或研發團隊。推動產業鏈各方加強深度協作,推動智能語音交互、智能可穿戴設備、智能服務機器人、材料及系統的關鍵技術突破和成果轉化。鼓勵企業離岸創新,將境外智能語音技術形成創新成果后在園區實現產業化。加強與本地高校聯動,合力制定語言學和人工智能交叉的復合型人才聯合培養計劃,推動人才引進與培養。
-
機器學習
+關注
關注
66文章
8501瀏覽量
134573 -
智能語音
+關注
關注
11文章
804瀏覽量
49518
原文標題:行業專報丨智能語音產業發展研究
文章出處:【微信號:cqiota,微信公眾號:重慶市物聯網產業協會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論