互聯網發展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發應用,發展智能產業成為科技行業工作的重中之重。協會特派記者走進深圳海岸語音技術有限公司,對石偉總經理進行了智能語音行業相關專訪。
深圳海岸語音技術有限公司創始人、總經理 石偉
記者:智能語音作為人工智能應用最成熟的技術之一,科技巨頭、初創公司紛紛布局,海岸語音是怎樣定位與布局?
石偉:從人機交互形式出發,語音識別無疑是人工智能產品與用戶之間,最便捷有效的交流形式。語音交互技術鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環節。在語音識別方面,百度、科大訊飛、谷歌等技術領先。我們主要做語音識別前端處理的技術,是一家專注于智能聽覺感知技術的人工智能初創企業,面向物聯網和人工智能時代,提供軟、硬件結合加云端引擎的一體化智能聽覺感知技術解決方案。
記者:海岸語音的產品及應用有哪些?
石偉:有別于傳統的標量麥克風技術,我們產品所采用的是聲學矢量傳感技術,可同時測量聲場的聲壓信息和方向信息,該技術最早源于潛艇的矢量水聽器,在空氣中的應用極少。我們團隊歷經 8 年研發,打造出 AI 時代必不可少的“機器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應用在機器人、智能音箱、家電等諸多領域。
記者:海岸語音的核心競爭力體現在哪些方面?
石偉:把產品做小、成本做低(幾美元左右)是我們研發的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機器人、智能家居、無人機、穿戴式設備以及智能車載等領域都有廣闊的應用前景。
作為 AI 時代機器必備的器件之一,“機器耳朵”需要更多的信息實現其智能的特性,這是傳統的標量麥克風所面臨的局限性。雖然在聲學傳感器的發展史上,各大研究機構嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術都具有各類不同的缺陷,使其無法在消費級產品中使用。
我們在小尺寸的單顆傳感器封裝內實現平面 360°聲音定向,并內置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。
在數量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應四至八顆傳感器組成的麥克風陣列,顯然具有突出的優勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。
記者:海岸語音發展過程中有遇到哪些困難?
石偉:目前我們產品還未正式推向市場,產品還在不斷地優化,找到行業典型應用是將要面臨的一大挑戰。在未來推向市場的時候,產品的正式落地希望能夠找到知名度較高的產品或廠商背書,進一步打開市場。
記者:石總怎么看待科技巨頭與初創公司在智能語音領域的發展模式?
石偉:科技巨頭主要打造開發者生態系統,使用算法平臺吸引開發者,實現數據的快速積累、產品的快速迭代。目前,在國內智能語音領域,科大訊飛是做得比較完善,一整條產業鏈相關技術產品都有涉及,并將自身語音技術植入相關合作伙伴的產品中,以推動智能語音和人工智能技術在家居、車載、可穿戴等領域的落地。
初創公司目前以垂直領域和細分場景為突破口,切入產品場景應用。初創企業不應求大、求全,而是結合自身優勢做最“性感”的技術和產品。
記者:海岸語音未來有些什么規劃?
石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術鏈條進行滲透,實現音頻和視頻融合的人機交互。我們會將底層的技術打包為完整的交互解決方案,服務 B 端客戶。
-
人機交互
+關注
關注
12文章
1235瀏覽量
56177 -
人工智能
+關注
關注
1804文章
48628瀏覽量
246100 -
智能語音
+關注
關注
11文章
797瀏覽量
49361
原文標題:對話 | 將聲矢量技術帶入消費級市場—專訪深圳海岸語音技術有限公司總經理石偉
文章出處:【微信號:SRA2009,微信公眾號:深圳市機器人協會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
智能語音新風尚:WTK6900語音識別芯片賦能未來家居,讓涼爽觸“聲”可及

語音識別技術在通信領域中的應用實例
TTS語音播報模塊簡介
HarmonyOS NEXT 應用開發練習:AI智能語音播報
語音識別技術在醫療領域的應用
語音識別技術的應用與發展
ASR語音識別技術應用
請問VOLIB語音庫不能用來處理實時語音嗎?
語音降噪 -音頻技術的一個重要話題

評論