微軟團(tuán)隊(duì)正探索如何將 OpenAI研發(fā)的ChatGPT擴(kuò)展到機(jī)器人領(lǐng)域,旨在讓人類用自然語(yǔ)言控制如機(jī)械臂、無(wú)人機(jī)、家庭輔助機(jī)器人等多個(gè)平臺(tái)。3月23日,OpenAI還領(lǐng)投了挪威人形機(jī)器人公司1X。
3月8日,谷歌和柏林工業(yè)大學(xué)的團(tuán)隊(duì)重磅推出了史上最大的視覺(jué)語(yǔ)言模型——PaLM-E,同時(shí)谷歌表示,計(jì)劃探索PaLM-E在現(xiàn)實(shí)世界場(chǎng)景中的更多應(yīng)用,例如家庭自動(dòng)化或工業(yè)機(jī)器人,希望PaLM-E能夠激發(fā)更多關(guān)于多模態(tài)推理和具身AI的研究。
據(jù)了解,阿里云工程師也正在實(shí)驗(yàn)將千問(wèn)大模型接入工業(yè)機(jī)器人,以便實(shí)現(xiàn)遠(yuǎn)程指揮機(jī)器人工作。在近日舉行的第六屆數(shù)字中國(guó)建設(shè)峰會(huì)上,阿里云發(fā)布的一個(gè)演示視頻中展示了千問(wèn)大模型的實(shí)際應(yīng)用場(chǎng)景。
“我渴了,找點(diǎn)東西喝吧。”工程師通過(guò)釘釘對(duì)話框向機(jī)器人發(fā)出指令后,千問(wèn)大模型回答,“好的,我找找有什么喝的。”隨后,千問(wèn)大模型在后臺(tái)自動(dòng)編寫(xiě)了一組代碼發(fā)給機(jī)器人,機(jī)器人開(kāi)始識(shí)別周邊環(huán)境,從附近的桌上找到一瓶水,并自動(dòng)完成移動(dòng)、抓取、配送等一系列動(dòng)作,遞送給工程師。
科幻電影中機(jī)器人和人交互的畫(huà)面正在變成現(xiàn)實(shí)。
▍技術(shù)能力解析
從技術(shù)原理上來(lái)理解,這意味著千問(wèn)大模型首先理解了人類這句話的內(nèi)容,然后在后臺(tái)自動(dòng)編寫(xiě)一組代碼發(fā)給機(jī)器人,機(jī)器人則完成識(shí)別周邊環(huán)境、找水至配送等一系列動(dòng)作。
在釘釘對(duì)話框輸入一句人類語(yǔ)言即可指揮機(jī)器人工作,這將為工業(yè)機(jī)器人的開(kāi)發(fā)和應(yīng)用帶來(lái)革命性的變化。其背后意味著大模型為工業(yè)機(jī)器人的開(kāi)發(fā)打開(kāi)了新的大門(mén)。因?yàn)榍?wèn)等大模型為機(jī)器人提供了推理決策的能力,從而有望讓機(jī)器人的靈活性和智能性大幅提升。
阿里云工程師表示,這種能力意味著新的變革。機(jī)器人之前能夠完成一些人類設(shè)置的固定任務(wù),但并不能執(zhí)行一些需要“隨機(jī)應(yīng)變”的任務(wù),“AI大模型突破了機(jī)器人的局限,讓人類可以通過(guò)自然語(yǔ)言指揮機(jī)器完成負(fù)責(zé)任務(wù),讓機(jī)器人真有了大腦。”
可以說(shuō)大模型的誕生為工業(yè)機(jī)器人打開(kāi)了一扇新的窗,據(jù)阿里云工程師介紹,例如在生產(chǎn)運(yùn)行時(shí),一線工程師只需發(fā)送一段文字,千問(wèn)就能理解其意圖進(jìn)行任務(wù)推理,并自動(dòng)翻譯成機(jī)器可以理解的代碼,指揮機(jī)器執(zhí)行任務(wù),有效提升生產(chǎn)效率。
阿里巴巴董事會(huì)主席兼 CEO、阿里云智能 CEO 張勇表示,數(shù)字化是基礎(chǔ),智能化是方向,當(dāng)前的人工智能浪潮是和 20 年前的數(shù)字化浪潮同等重要的機(jī)會(huì),行業(yè)正處于智能化時(shí)代的歷史新起點(diǎn)。阿里正朝著這個(gè)方向快速邁進(jìn)。
“就像數(shù)字化時(shí)代出現(xiàn)一批數(shù)字原生企業(yè),智能化時(shí)代也必將出現(xiàn)一系列智能原生企業(yè)。我們深刻感受到,‘所有不可想象,終將化為尋常’。”他說(shuō)。
目前,人們依然嚴(yán)重依賴代碼來(lái)實(shí)現(xiàn)對(duì)機(jī)器人的控制,人類操作機(jī)器人需要學(xué)習(xí)復(fù)雜的編程語(yǔ)言或機(jī)器人系統(tǒng)的細(xì)節(jié),而GPT等大模型的出現(xiàn),為推翻豎立在人類與AI面前的“巴別塔”提供了新思路,即將多模態(tài)的大語(yǔ)言模型作為人類與機(jī)器人溝通的橋梁。
正如阿里云工程師所說(shuō),“AI大模型突破了機(jī)器人的局限,讓人類可以通過(guò)自然語(yǔ)言指揮機(jī)器完成負(fù)責(zé)任務(wù),讓機(jī)器人真正有了大腦。”
張勇也表示,由于實(shí)體經(jīng)濟(jì)是智能化主戰(zhàn)場(chǎng),新的AI大模型讓千行百業(yè)將被重新定義。“AI大模型將以更低門(mén)檻、更高效率,打通一個(gè)個(gè)數(shù)據(jù)斷流節(jié)點(diǎn),推動(dòng)數(shù)據(jù)在研發(fā)、生產(chǎn)、配送、服務(wù)等環(huán)節(jié)暢通流動(dòng),服務(wù)實(shí)體經(jīng)濟(jì)的智能化升級(jí)。”
當(dāng)然,大模型對(duì)機(jī)器人領(lǐng)域的加持不僅體現(xiàn)在應(yīng)用環(huán)節(jié),也可參與開(kāi)發(fā)環(huán)節(jié)。
面向制造領(lǐng)域,阿里云將進(jìn)一步融合千問(wèn)大模型與阿里云物聯(lián)網(wǎng)平臺(tái)能力,為企業(yè)提供智能解決方案,讓生產(chǎn)制造全流程變得更智能、更高效。
據(jù)阿里云工程師介紹,在機(jī)器人開(kāi)發(fā)階段,工程師可通過(guò)千問(wèn)大模型自動(dòng)生成代碼指令完成機(jī)器人功能的開(kāi)發(fā)與調(diào)試,甚至還能為機(jī)器人創(chuàng)造一些全新的功能。
日前,阿里云已宣布啟動(dòng)“通義千問(wèn)伙伴計(jì)劃”,將優(yōu)先為千問(wèn)伙伴提供大模型領(lǐng)域的技術(shù)、服務(wù)與產(chǎn)品支持,共同推動(dòng)大模型在不同行業(yè)的應(yīng)用,已有超20萬(wàn)企業(yè)用戶申請(qǐng)接入千問(wèn)測(cè)試。
▍難點(diǎn)和未來(lái)
不過(guò),大模型只是提供了一種新思路,距離能聽(tīng)懂“人話”的機(jī)器人面世,或許還有很長(zhǎng)的路要走。
因?yàn)檎Z(yǔ)言模型固然可以為機(jī)器人提供更好的步驟規(guī)劃評(píng)估和選擇,但并不能面面俱到,比如不能告訴機(jī)器人打開(kāi)冰箱時(shí)應(yīng)施加多大的力。因此,我們發(fā)現(xiàn)全世界包括谷歌在內(nèi)的巨頭也暫時(shí)沒(méi)有將裝上大模型的機(jī)器人商業(yè)化的計(jì)劃。
但制造業(yè)是AI大模型的重要應(yīng)用場(chǎng)景之一,未來(lái)的機(jī)遇在于云、AI與物理世界機(jī)器的融合,AI大模型必然能為工業(yè)機(jī)器人、服務(wù)機(jī)器人的智能化發(fā)展帶來(lái)了新的機(jī)遇和挑戰(zhàn),而這也將推動(dòng)實(shí)體經(jīng)濟(jì)向更加智能化的方向發(fā)展。
為此,除了阿里外,國(guó)內(nèi)多家互聯(lián)網(wǎng)巨頭也在AI+機(jī)器人領(lǐng)域動(dòng)作頻頻。
4月25日,據(jù)騰訊Robotics X實(shí)驗(yàn)室公布最新機(jī)器人研究進(jìn)展,首次展示在靈巧操作領(lǐng)域的成果,推出自研機(jī)器人靈巧手“TRX-Hand”和機(jī)械臂“TRX-Arm”。
4月24日,據(jù)企查查APP顯示,近日北京小米機(jī)器人技術(shù)有限公司成立,注冊(cè)資本5000萬(wàn)元人民幣。經(jīng)營(yíng)范圍包含:智能機(jī)器人的研發(fā);人工智能行業(yè)應(yīng)用系統(tǒng)集成服務(wù);人工智能基礎(chǔ)資源與技術(shù)平臺(tái);微特電機(jī)及組件制造等。資料顯示,小米在國(guó)內(nèi)機(jī)器人布局版圖不斷擴(kuò)大,從CyberDog(仿生機(jī)器狗),再到Cyberone(仿生機(jī)器人),持續(xù)加注在機(jī)器人領(lǐng)域的研發(fā)和創(chuàng)新。
而國(guó)內(nèi)2022年受益于汽車(chē)動(dòng)力 電池、光伏等新能源行業(yè)的發(fā)展機(jī)遇,隨著今年工業(yè)機(jī)器人行業(yè)景氣度繼續(xù)提升,多家機(jī)器人企業(yè)也在開(kāi)辟自己的新方向,例如通過(guò)機(jī)器視覺(jué)、傳感器等相關(guān)技術(shù)的發(fā)展及與工業(yè)機(jī)器人深度結(jié)合,促進(jìn)工業(yè)機(jī)器人的可用性和易用性。
根據(jù)國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì),2015—2022年我國(guó)工業(yè)機(jī)器人產(chǎn)量由3.30萬(wàn)臺(tái)增長(zhǎng)至44.31 萬(wàn)臺(tái),CAGR達(dá)44.92%,2023年1-3月工業(yè)機(jī)器人累計(jì)產(chǎn)量10.37萬(wàn)臺(tái),同比-3.00%,工業(yè)機(jī)器人行業(yè)正步入窗口期。多家企業(yè)收入實(shí)現(xiàn)快速增長(zhǎng),但盈利能力需要進(jìn)一步改善。
從發(fā)展方向上看,隨著工業(yè)機(jī)器人應(yīng)用門(mén)檻的下降,工業(yè)機(jī)器人的應(yīng)用已經(jīng)不再局限于對(duì)負(fù)載、響應(yīng)性、一致性要求較高的行業(yè),AI的發(fā)展更是已經(jīng)推動(dòng)了機(jī)器人企業(yè)軟硬件迭代加速。未來(lái)工業(yè)機(jī)器人的發(fā)展以提升應(yīng)用廣度和深度為方向,其中運(yùn)動(dòng)控制技術(shù)、控制系統(tǒng)技術(shù)促進(jìn)產(chǎn)品性能提升,AI相關(guān)技術(shù)促進(jìn)智能化提升,未來(lái)工業(yè)機(jī)器人會(huì)向著智能化、精細(xì)化方向努力,另一部分硬件制造、集成新技術(shù)則推動(dòng)工業(yè)機(jī)器人賦能多行業(yè)進(jìn)一步深化。
審核編輯 :李倩
-
AI
+關(guān)注
關(guān)注
87文章
34274瀏覽量
275455 -
智能化
+關(guān)注
關(guān)注
15文章
5103瀏覽量
56951 -
工業(yè)機(jī)器人
+關(guān)注
關(guān)注
91文章
3446瀏覽量
93744
原文標(biāo)題:為機(jī)器人注入靈魂?阿里“千問(wèn)”大模型帶來(lái)了哪些新動(dòng)向?
文章出處:【微信號(hào):信息與電子工程前沿FITEE,微信公眾號(hào):信息與電子工程前沿FITEE】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論