AI可能很快就會成為盟友,以消除語音助手的喚醒詞。卡內(nèi)基梅隆大學(xué)的研究人員開發(fā)了一種機器學(xué)習(xí)模型,該模型可以估計語音的發(fā)出方向,無需特殊的短語或手勢即可表明您的意圖。該方法依賴于聲音在房間周圍反彈時的固有特性。
系統(tǒng)認(rèn)識到,第一個,最響亮和最清晰的聲音始終是直接針對給定對象的聲音。其他任何事情都傾向于安靜,延遲和悶悶不樂。該模型還知道,人類的語音頻率會根據(jù)您所面對的方向而變化。較低的頻率傾向于全向。
研究人員補充說,這種方法基于軟件“輕巧”,不需要將音頻數(shù)據(jù)發(fā)送到云。
盡管團隊已經(jīng)公開發(fā)布了代碼和數(shù)據(jù)來幫助其他人繼續(xù)工作,但是您可能還需要一段時間才能看到使用的技術(shù)。至少很容易看出這可能導(dǎo)致什么。您可以告訴智能揚聲器播放音樂,而無需使用喚醒詞或引起大量其他連接設(shè)備的騷擾。它可能需要您的身體狀態(tài),而無需使用注視檢測相機,從而有助于保護隱私。換句話說,它將更接近“星際迷航”中語音助手的愿景,后者始終會在您與他們交談時知道。
責(zé)任編輯:lq
-
代碼
+關(guān)注
關(guān)注
30文章
4886瀏覽量
70241 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8490瀏覽量
134074 -
語音助手
+關(guān)注
關(guān)注
7文章
239瀏覽量
27057
發(fā)布評論請先 登錄
研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測瘧疾
NanoEdge AI Studio 面向STM32開發(fā)人員機器學(xué)習(xí)(ML)技術(shù)

Qwen大模型助力開發(fā)低成本AI推理方案
【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型
研究人員利用激光束開創(chuàng)量子計算新局面

NaVILA:加州大學(xué)與英偉達聯(lián)合發(fā)布新型視覺語言模型
一種信息引導(dǎo)的量化后LLM微調(diào)新算法IR-QLoRA

名單公布!【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南
【《大語言模型應(yīng)用指南》閱讀體驗】+ 俯瞰全書
rup是一種什么模型
Al大模型機器人
日本九州大學(xué)開發(fā)了名為QDyeFinder的人工智能(AI)工具
研究人員提出一種電磁微鏡驅(qū)動系統(tǒng)
基于一種AI輔助可穿戴微流控比色傳感器系統(tǒng)

研究人員利用人工智能提升超透鏡相機的圖像質(zhì)量

評論