電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)ChatGPT的熱度仍在持續(xù),盡管從表面上看,它只是一種更加智能的聊天機(jī)器人,但畢竟這只是AI表現(xiàn)形式的一種,背后的技術(shù)最終能夠擴(kuò)展到哪些領(lǐng)域,能給各個(gè)行業(yè)帶來(lái)哪些變化,是業(yè)界更為關(guān)注的。
隨著汽車(chē)智能化進(jìn)程加深,近幾年AI技術(shù)在汽車(chē)上的地位持續(xù)提高,包括自動(dòng)駕駛、智能座艙等都大量用到AI技術(shù)。那么ChatGPT的出現(xiàn),伴隨著這一輪新的熱潮,智能汽車(chē)領(lǐng)域會(huì)帶來(lái)哪些變化?
顛覆座艙語(yǔ)音交互體驗(yàn)?
對(duì)于ChatGPT的落地應(yīng)用,微軟給出的答案是搜索引擎,利用對(duì)話(huà)的方式給搜索引擎帶來(lái)顛覆性的交互體驗(yàn)。而在汽車(chē)上,目前在智能座艙中的一個(gè)顯著趨勢(shì)就是在交互上,逐步減少非必要的實(shí)體按鍵,轉(zhuǎn)向使用觸摸和語(yǔ)音等形式來(lái)對(duì)座艙不同功能進(jìn)行操作。
作為“Chat”功能為主的AI模型,我們很容易能聯(lián)想到ChatGPT技術(shù)被用到語(yǔ)音助手中,其中就包括當(dāng)前重語(yǔ)音交互的汽車(chē)智能座艙。語(yǔ)音交互流程中包含語(yǔ)音識(shí)別、自然語(yǔ)言理解/處理、自然語(yǔ)言生成、文字轉(zhuǎn)語(yǔ)音這幾項(xiàng)技術(shù),以目前主流廠(chǎng)商推出的產(chǎn)品來(lái)看,語(yǔ)音識(shí)別的準(zhǔn)確率已經(jīng)可以做到很高,而文字轉(zhuǎn)語(yǔ)音更加是已經(jīng)被普及到各大短視頻平臺(tái),視頻AI配音都幾乎可以實(shí)現(xiàn)以假亂真的效果。
但盡管語(yǔ)音助手這一應(yīng)用已經(jīng)在智能手機(jī)上大規(guī)模應(yīng)用十多年了,但發(fā)展似乎陷入一定程度的停滯,很多時(shí)候智能手機(jī)語(yǔ)音助手能夠準(zhǔn)確識(shí)別出用戶(hù)的話(huà),但問(wèn)題是依然無(wú)法準(zhǔn)確理解用戶(hù)的大部分指令,無(wú)法回答或是作出相應(yīng)指令。
如今車(chē)載語(yǔ)音交互在識(shí)別指令方面已經(jīng)有了一定進(jìn)步,可以識(shí)別連續(xù)的語(yǔ)音指令,但本質(zhì)上,語(yǔ)音助手依然只能識(shí)別一些固定的指令組合,而進(jìn)行相應(yīng)固定的操作。因此,車(chē)載語(yǔ)音助手實(shí)際上依然稱(chēng)不上“智能”。
ChatGPT的出現(xiàn)可能將會(huì)給智能語(yǔ)音行業(yè)帶來(lái)一定改變,從之前的體驗(yàn)中我們已經(jīng)認(rèn)識(shí)到ChatGPT的對(duì)話(huà)能力,不僅能夠“理解”用戶(hù)的對(duì)話(huà),還能結(jié)合上下文的語(yǔ)境來(lái)進(jìn)行有“邏輯”的交流。盡管由于數(shù)據(jù)來(lái)源的問(wèn)題可能導(dǎo)致一些內(nèi)容準(zhǔn)確度不高,但在汽車(chē)座艙應(yīng)用中,或許可以結(jié)合這類(lèi)語(yǔ)音模型來(lái)大幅提升車(chē)載語(yǔ)音交互的用戶(hù)體驗(yàn)。
目前車(chē)載語(yǔ)音的市場(chǎng)主要是科大訊飛和Cerence所主導(dǎo),但也有很多新勢(shì)力車(chē)企較早布局自研語(yǔ)音,比如小鵬、理想等,采用科大訊飛、思必馳、微軟等供應(yīng)商提供的底層技術(shù),自研出有特色的語(yǔ)音系統(tǒng)。比如小鵬主打的全場(chǎng)景語(yǔ)音,可以同時(shí)識(shí)別多人指令,并可以分辨出無(wú)效語(yǔ)義,實(shí)現(xiàn)邊說(shuō)話(huà)邊提出指令。
如果ChatGPT或是其他有類(lèi)似產(chǎn)品的公司入局車(chē)載語(yǔ)音,則有可能對(duì)目前各家語(yǔ)音技術(shù)供應(yīng)商的技術(shù)路線(xiàn),或是整個(gè)市場(chǎng)格局,都會(huì)產(chǎn)生很大影響。
最近百度的類(lèi)ChatGPT大模型AI交互項(xiàng)目文心一言,已經(jīng)有長(zhǎng)城、集度、哪吒、愛(ài)馳、嵐圖等車(chē)企宣布接入,但最終實(shí)際效果還需要產(chǎn)品裝車(chē)后才能知道了。
自動(dòng)駕駛能跟ChatGPT有什么關(guān)系?
ChatGPT從底層技術(shù)上看,是屬于NLP自然語(yǔ)言處理領(lǐng)域,但NLP并不局限于文字方面的應(yīng)用,視覺(jué)識(shí)別領(lǐng)域中Transformer大模型早已被廣泛應(yīng)用,而Transformer本身就屬于NLP領(lǐng)域的一種訓(xùn)練模型。
因此,ChatGPT可能不會(huì)直接對(duì)自動(dòng)駕駛產(chǎn)生什么推動(dòng)作用,而是在人機(jī)交互方面會(huì)有更大的貢獻(xiàn)。但ChatGPT背后的技術(shù)路線(xiàn),可能會(huì)推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展。
在ChatGPT中,與以往的GPT模型不同的是加入了人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)的技術(shù),利用人類(lèi)提供的內(nèi)容來(lái)判斷自己回答質(zhì)量,從而不斷迭代改進(jìn)。據(jù)毫末智行介紹,在自動(dòng)駕駛領(lǐng)域中,這種技術(shù)可以通過(guò)不斷輸入真實(shí)人駕接管數(shù)據(jù),持續(xù)優(yōu)化自動(dòng)駕駛決策模型。
毫末智行近期表示將自動(dòng)駕駛認(rèn)知大模型正式升級(jí)為DriveGPT,未來(lái)將在大模型中使用RLHF算法,讓模型學(xué)習(xí)人類(lèi)駕駛接管的數(shù)據(jù)。比如在同樣的駕駛環(huán)境下,如果人類(lèi)駕駛的動(dòng)作與算法決策一致,不選擇接管,則記為一個(gè)good case;如果人類(lèi)司機(jī)接管了,就記為一個(gè)bad case。即通過(guò)好壞的判斷引導(dǎo)自動(dòng)駕駛算法做出更接近人類(lèi)的決策。
寫(xiě)在最后
目前從車(chē)載應(yīng)用來(lái)看,類(lèi)ChatGPT的最佳應(yīng)用場(chǎng)景只有車(chē)內(nèi)語(yǔ)音交互。有業(yè)內(nèi)人士認(rèn)為,車(chē)載語(yǔ)音市場(chǎng)空間并不大,目前幾乎壟斷該市場(chǎng)的科大訊飛和Cerence在該領(lǐng)域收入實(shí)際稱(chēng)不上理想,這種情況下用訓(xùn)練成本極高的ChatGPT似乎有點(diǎn)小材大用。不過(guò)百度的文心一言近期已經(jīng)官宣上車(chē),未來(lái)可以期待一下更加智能的語(yǔ)音對(duì)話(huà)在智能汽車(chē)上會(huì)帶來(lái)怎樣的體驗(yàn)變化。
隨著汽車(chē)智能化進(jìn)程加深,近幾年AI技術(shù)在汽車(chē)上的地位持續(xù)提高,包括自動(dòng)駕駛、智能座艙等都大量用到AI技術(shù)。那么ChatGPT的出現(xiàn),伴隨著這一輪新的熱潮,智能汽車(chē)領(lǐng)域會(huì)帶來(lái)哪些變化?
顛覆座艙語(yǔ)音交互體驗(yàn)?
對(duì)于ChatGPT的落地應(yīng)用,微軟給出的答案是搜索引擎,利用對(duì)話(huà)的方式給搜索引擎帶來(lái)顛覆性的交互體驗(yàn)。而在汽車(chē)上,目前在智能座艙中的一個(gè)顯著趨勢(shì)就是在交互上,逐步減少非必要的實(shí)體按鍵,轉(zhuǎn)向使用觸摸和語(yǔ)音等形式來(lái)對(duì)座艙不同功能進(jìn)行操作。
作為“Chat”功能為主的AI模型,我們很容易能聯(lián)想到ChatGPT技術(shù)被用到語(yǔ)音助手中,其中就包括當(dāng)前重語(yǔ)音交互的汽車(chē)智能座艙。語(yǔ)音交互流程中包含語(yǔ)音識(shí)別、自然語(yǔ)言理解/處理、自然語(yǔ)言生成、文字轉(zhuǎn)語(yǔ)音這幾項(xiàng)技術(shù),以目前主流廠(chǎng)商推出的產(chǎn)品來(lái)看,語(yǔ)音識(shí)別的準(zhǔn)確率已經(jīng)可以做到很高,而文字轉(zhuǎn)語(yǔ)音更加是已經(jīng)被普及到各大短視頻平臺(tái),視頻AI配音都幾乎可以實(shí)現(xiàn)以假亂真的效果。
但盡管語(yǔ)音助手這一應(yīng)用已經(jīng)在智能手機(jī)上大規(guī)模應(yīng)用十多年了,但發(fā)展似乎陷入一定程度的停滯,很多時(shí)候智能手機(jī)語(yǔ)音助手能夠準(zhǔn)確識(shí)別出用戶(hù)的話(huà),但問(wèn)題是依然無(wú)法準(zhǔn)確理解用戶(hù)的大部分指令,無(wú)法回答或是作出相應(yīng)指令。
如今車(chē)載語(yǔ)音交互在識(shí)別指令方面已經(jīng)有了一定進(jìn)步,可以識(shí)別連續(xù)的語(yǔ)音指令,但本質(zhì)上,語(yǔ)音助手依然只能識(shí)別一些固定的指令組合,而進(jìn)行相應(yīng)固定的操作。因此,車(chē)載語(yǔ)音助手實(shí)際上依然稱(chēng)不上“智能”。
ChatGPT的出現(xiàn)可能將會(huì)給智能語(yǔ)音行業(yè)帶來(lái)一定改變,從之前的體驗(yàn)中我們已經(jīng)認(rèn)識(shí)到ChatGPT的對(duì)話(huà)能力,不僅能夠“理解”用戶(hù)的對(duì)話(huà),還能結(jié)合上下文的語(yǔ)境來(lái)進(jìn)行有“邏輯”的交流。盡管由于數(shù)據(jù)來(lái)源的問(wèn)題可能導(dǎo)致一些內(nèi)容準(zhǔn)確度不高,但在汽車(chē)座艙應(yīng)用中,或許可以結(jié)合這類(lèi)語(yǔ)音模型來(lái)大幅提升車(chē)載語(yǔ)音交互的用戶(hù)體驗(yàn)。
目前車(chē)載語(yǔ)音的市場(chǎng)主要是科大訊飛和Cerence所主導(dǎo),但也有很多新勢(shì)力車(chē)企較早布局自研語(yǔ)音,比如小鵬、理想等,采用科大訊飛、思必馳、微軟等供應(yīng)商提供的底層技術(shù),自研出有特色的語(yǔ)音系統(tǒng)。比如小鵬主打的全場(chǎng)景語(yǔ)音,可以同時(shí)識(shí)別多人指令,并可以分辨出無(wú)效語(yǔ)義,實(shí)現(xiàn)邊說(shuō)話(huà)邊提出指令。
如果ChatGPT或是其他有類(lèi)似產(chǎn)品的公司入局車(chē)載語(yǔ)音,則有可能對(duì)目前各家語(yǔ)音技術(shù)供應(yīng)商的技術(shù)路線(xiàn),或是整個(gè)市場(chǎng)格局,都會(huì)產(chǎn)生很大影響。
最近百度的類(lèi)ChatGPT大模型AI交互項(xiàng)目文心一言,已經(jīng)有長(zhǎng)城、集度、哪吒、愛(ài)馳、嵐圖等車(chē)企宣布接入,但最終實(shí)際效果還需要產(chǎn)品裝車(chē)后才能知道了。
自動(dòng)駕駛能跟ChatGPT有什么關(guān)系?
ChatGPT從底層技術(shù)上看,是屬于NLP自然語(yǔ)言處理領(lǐng)域,但NLP并不局限于文字方面的應(yīng)用,視覺(jué)識(shí)別領(lǐng)域中Transformer大模型早已被廣泛應(yīng)用,而Transformer本身就屬于NLP領(lǐng)域的一種訓(xùn)練模型。
因此,ChatGPT可能不會(huì)直接對(duì)自動(dòng)駕駛產(chǎn)生什么推動(dòng)作用,而是在人機(jī)交互方面會(huì)有更大的貢獻(xiàn)。但ChatGPT背后的技術(shù)路線(xiàn),可能會(huì)推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展。
在ChatGPT中,與以往的GPT模型不同的是加入了人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)的技術(shù),利用人類(lèi)提供的內(nèi)容來(lái)判斷自己回答質(zhì)量,從而不斷迭代改進(jìn)。據(jù)毫末智行介紹,在自動(dòng)駕駛領(lǐng)域中,這種技術(shù)可以通過(guò)不斷輸入真實(shí)人駕接管數(shù)據(jù),持續(xù)優(yōu)化自動(dòng)駕駛決策模型。
毫末智行近期表示將自動(dòng)駕駛認(rèn)知大模型正式升級(jí)為DriveGPT,未來(lái)將在大模型中使用RLHF算法,讓模型學(xué)習(xí)人類(lèi)駕駛接管的數(shù)據(jù)。比如在同樣的駕駛環(huán)境下,如果人類(lèi)駕駛的動(dòng)作與算法決策一致,不選擇接管,則記為一個(gè)good case;如果人類(lèi)司機(jī)接管了,就記為一個(gè)bad case。即通過(guò)好壞的判斷引導(dǎo)自動(dòng)駕駛算法做出更接近人類(lèi)的決策。
寫(xiě)在最后
目前從車(chē)載應(yīng)用來(lái)看,類(lèi)ChatGPT的最佳應(yīng)用場(chǎng)景只有車(chē)內(nèi)語(yǔ)音交互。有業(yè)內(nèi)人士認(rèn)為,車(chē)載語(yǔ)音市場(chǎng)空間并不大,目前幾乎壟斷該市場(chǎng)的科大訊飛和Cerence在該領(lǐng)域收入實(shí)際稱(chēng)不上理想,這種情況下用訓(xùn)練成本極高的ChatGPT似乎有點(diǎn)小材大用。不過(guò)百度的文心一言近期已經(jīng)官宣上車(chē),未來(lái)可以期待一下更加智能的語(yǔ)音對(duì)話(huà)在智能汽車(chē)上會(huì)帶來(lái)怎樣的體驗(yàn)變化。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
AI
+關(guān)注
關(guān)注
88文章
35217瀏覽量
280373 -
智能汽車(chē)
+關(guān)注
關(guān)注
30文章
3093瀏覽量
108414 -
智能語(yǔ)音交互
+關(guān)注
關(guān)注
0文章
29瀏覽量
3042 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1590瀏覽量
9132
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
“兩會(huì)”熱議“機(jī)器人和飛行汽車(chē)”,核心動(dòng)力電機(jī)可能會(huì)火
:“兩會(huì)”熱議“機(jī)器人和飛行汽車(chē)”,核心動(dòng)力電機(jī)可能會(huì)火.doc
本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容!
發(fā)表于 03-31 13:35

和安信可Ai-M61模組對(duì)話(huà)?手搓一個(gè)ChatGPT 語(yǔ)音助手 #人工智能 #
ChatGPT
jf_31745078
發(fā)布于 :2025年03月12日 15:56:59
一夜爆火的DeepSeek一體機(jī),如何改寫(xiě)AI游戲規(guī)則?
一夜爆火的DeepSeek一體機(jī),如何改寫(xiě)AI游戲規(guī)則? 過(guò)去一個(gè)多月,科技圈有個(gè)“新晉頂流”C位出道,名字叫DeepSeek一體機(jī)。 它火到什么程度? 朋友圈不斷刷屏,有人調(diào)侃:“沒(méi)搶到

又一個(gè)中國(guó)AI產(chǎn)品Manus刷屏 中國(guó)AI新星Manus爆火 全網(wǎng)搶邀請(qǐng)碼
Manus 的 AI 產(chǎn)品在科技圈一夜爆火,全球首款通用智能體Manus開(kāi)啟內(nèi)測(cè)爆火,據(jù)說(shuō)現(xiàn)在很多的網(wǎng)友都在求Manus邀請(qǐng)碼。而Manus
燧原科技助力美圖AI換裝全球爆火
2025蛇年元宵后,美圖公司旗下美顏相機(jī)憑借“AI換裝”功能爆火,獲得了國(guó)內(nèi)外用戶(hù)的極大青睞,App下載量和使用量迅速激增的同時(shí),也面臨了海量推理算力即時(shí)支持的挑戰(zhàn)。
OpenAI免費(fèi)開(kāi)放ChatGPT搜索功能
近日,OpenAI宣布了一項(xiàng)重大決策:向所有用戶(hù)免費(fèi)開(kāi)放ChatGPT搜索功能。這一舉措無(wú)疑將為用戶(hù)帶來(lái)更加高效、智能的搜索體驗(yàn)。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜
石墨烯發(fā)熱油墨為汽車(chē)后視鏡帶來(lái)智能電加熱保護(hù)
Haydale石墨烯發(fā)熱油墨采用了先進(jìn)的石墨烯納米材料,這是一種極為強(qiáng)大的導(dǎo)電材料。通過(guò)將石墨烯發(fā)熱油墨應(yīng)用于汽車(chē)后視鏡的電加熱膜中,利用Haydale石墨烯發(fā)熱油墨可以創(chuàng)造一種智能的遠(yuǎn)紅外發(fā)熱膜
發(fā)表于 11-15 15:55
蘋(píng)果iOS 18.2公測(cè)版發(fā)布,Siri與ChatGPT深度融合
,用戶(hù)無(wú)需創(chuàng)建賬戶(hù),即可通過(guò)Siri免費(fèi)享受ChatGPT帶來(lái)的智能服務(wù)。Siri將結(jié)合ChatGPT的專(zhuān)業(yè)知識(shí),以更加精準(zhǔn)、高效的方式回答用戶(hù)的問(wèn)題。同時(shí),在調(diào)用
汽車(chē)智能化會(huì)帶來(lái)哪些新機(jī)遇?
編者語(yǔ): 「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù): C-0560 ,獲取本文參考報(bào)告:《國(guó)信證券:汽車(chē)智能化下的投資機(jī)遇探析》pdf下載方式。 全球科技的高速發(fā)展為汽車(chē)產(chǎn)業(yè)帶來(lái)了智能化浪潮,

ChatGPT:怎樣打造智能客服體驗(yàn)的重要工具?
ChatGPT作為智能對(duì)話(huà)生成模型,可以幫助打造智能客服體驗(yàn)的重要工具。以下是一些方法和步驟:1.數(shù)據(jù)收集和準(zhǔn)備:收集和整理與客服相關(guān)的數(shù)據(jù),包括常見(jiàn)問(wèn)題、回答示例、客戶(hù)對(duì)話(huà)記錄等。這將用于訓(xùn)練

ChatGPT 與人工智能的未來(lái)發(fā)展
ChatGPT是人工智能領(lǐng)域的一個(gè)重要里程碑,它代表了自然語(yǔ)言處理(NLP)技術(shù)的最新進(jìn)展。ChatGPT是由人工智能研究實(shí)驗(yàn)室OpenAI開(kāi)發(fā)的一種深度學(xué)習(xí)模型,它能夠理解和生成自然
ChatGPT 適合哪些行業(yè)
ChatGPT 是一種基于人工智能的自然語(yǔ)言處理技術(shù),它能夠理解和生成人類(lèi)語(yǔ)言。這種技術(shù)在多個(gè)行業(yè)中都有廣泛的應(yīng)用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應(yīng)用方式
華納云:ChatGPT 登陸 Windows
ChatGPT 桌面應(yīng)用,您可以聊聊文件和照片。這款應(yīng)用為您帶來(lái)了 OpenAI 最新的模型改進(jìn),包括訪(fǎng)問(wèn)我們最新、最智能的模型OpenAI o1-preview 。” Windows 版
ChatGPT背后的AI背景、技術(shù)門(mén)道和商業(yè)應(yīng)用
作者:京東科技 李俊兵 各位看官好,我是球神(江湖代號(hào))。 自去年11月30日ChatGPT問(wèn)世以來(lái),迅速爆火出圈。 起初我依然以為這是和當(dāng)年Transformer, Bert一樣的“熱點(diǎn)”模型

評(píng)論