女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【AI簡報20230818期】人形機器人問世:大模型加持;用AI微調(diào)AI,微軟全華班出品!

RTThread物聯(lián)網(wǎng)操作系統(tǒng) ? 來源:未知 ? 2023-08-18 18:15 ? 次閱讀

1. 騰訊云宣布全面支持Llama2等主流開源模型

原文:https://t.cj.sina.com.cn/articles/view/1654203637/629924f5020010xw1?from=tech

騰訊云方面16日宣布,騰訊云TI平臺已經(jīng)全面接入Llama 2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多個主流模型,這些主流模型支持直接部署調(diào)用、應(yīng)用流程簡單、可全程低代碼操作。企業(yè)、開發(fā)者可以根據(jù)不同細(xì)分場景的業(yè)務(wù)需求,靈活選擇各類大模型,降低大模型使用成本。

efc6a702-3dae-11ee-ac96-dac502259ad0.jpg

據(jù)騰訊云公眾號透露,騰訊云是國內(nèi)第一批上架和支持開源模型的大模型廠商,騰訊云持續(xù)推動MaaS(Model-as-a-Service)建設(shè),讓大模型更懂行業(yè)、更易落地。

f002caca-3dae-11ee-ac96-dac502259ad0.jpg

在具體執(zhí)行方面,騰訊云發(fā)布了行業(yè)大模型解決方案,依托騰訊云TI平臺打造行業(yè)大模型精選商店,提供涵蓋模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)等一站式行業(yè)大模型服務(wù),已為10大行業(yè)提供了超50個大模型解決方案。騰訊云還推動大模型時代底層基礎(chǔ)設(shè)施建設(shè),發(fā)力算力、網(wǎng)絡(luò)、數(shù)據(jù)“鐵三角”,為客戶提供HCC高性能計算集群、星脈高性能計算網(wǎng)絡(luò)以及向量數(shù)據(jù)庫等基礎(chǔ)設(shè)施服務(wù),加速大模型落地。與此同時,騰訊云積極參與、推動行業(yè)大模型標(biāo)準(zhǔn)建設(shè)。早在2020年,騰訊就被選舉為全國信標(biāo)委人工智能分委會委員兼副秘書長。前不久,騰訊云聯(lián)合信通院牽頭開展國內(nèi)首個金融行業(yè)大模型標(biāo)準(zhǔn),助力金融行業(yè)智能化的高質(zhì)量規(guī)范化發(fā)展。

2. 稚暉君人形機器人問世:大模型加持,會自己換胳膊,要上生產(chǎn)線造車

原文:https://mp.weixin.qq.com/s/cgfbJgl9enzGXGTb6q6FGA
大模型技術(shù)的新一波浪潮:具身智能,已經(jīng)有了重要進展。剛剛,稚暉君的創(chuàng)業(yè)公司「智元機器人」開了自己的第一場發(fā)布會。

f01fa6c2-3dae-11ee-ac96-dac502259ad0.gif

以「天才少年」身份加入華為的稚暉君(彭志輝)于去年底宣布離職創(chuàng)業(yè),人們都在關(guān)注他在機器人與大模型方向探索的新實踐。今天在上海,他成立的智元機器人終于發(fā)布了首款產(chǎn)品「遠(yuǎn)征 A1」。在現(xiàn)場,機器人走上了講臺,這是稚暉君創(chuàng)業(yè)以來交出的第一份答卷。

f186e872-3dae-11ee-ac96-dac502259ad0.gif

遠(yuǎn)征 A1 不僅長得像人,也有著近似人類的一系列數(shù)據(jù):它身高 175cm,重 53kg,最高步速達(dá)到 7km/h,全身有 49 個自由度,可以承重 80kg,單臂最大負(fù)載 5kg。這款機器人在雙足行走、智能任務(wù)、人機互動等領(lǐng)域展現(xiàn)了業(yè)界領(lǐng)先的能力。

f3564774-3dae-11ee-ac96-dac502259ad0.png

稚暉君表示:「遠(yuǎn)征 A1 是我們的第一臺通用型智具身智能機器人,它融合了各種先進的本體控制、感知、認(rèn)知和決策的智能技術(shù),基于當(dāng)前 AI 領(lǐng)域前沿的大語言模型,以及我們自研的視覺控制模型,完成了一系列創(chuàng)新。」此前,很多機器人產(chǎn)品大多具備 20 余個自由度。據(jù)介紹,遠(yuǎn)征 A1 的 49 個自由度是考慮到實際應(yīng)用場景,如汽車生產(chǎn)過程中整理線束、擰螺絲、總裝等任務(wù)來確定的。它雖然是個人形機器人,但從一開始就面向工業(yè)制造:

未來也可以成為人們?nèi)粘I畹闹郑?/span>

「遠(yuǎn)征 A1」是模塊化的,可以面向不同任務(wù),自己給自己換組件:

f75d0c04-3dae-11ee-ac96-dac502259ad0.gif

稚暉君表示,把機器人做得像人,是因為現(xiàn)在的世界一直是為人形態(tài)而設(shè)計的,人形機器人可以在大量工作中直接應(yīng)用現(xiàn)有工具、任務(wù)和場景,同時更具有親和力。但想讓機器人模仿人類,需要在機械設(shè)計、運動和感知等方面解決很多挑戰(zhàn)。

自研電機,模塊化設(shè)計

用兩條腿來走路,又能夠擁有生產(chǎn)力,這意味著硬件設(shè)計要有強大的能力。智元機器人構(gòu)建了一套自研的硬件系統(tǒng),包括關(guān)節(jié)電機、靈巧手等。如果從零部件算,整個機器人的國產(chǎn)化率在 80% 以上。
自研核心關(guān)節(jié)電機 PowerFlow
如果想讓人形機器人行動靈敏、準(zhǔn)確,它的關(guān)節(jié)需要滿足很多條件,比如體積小、重量輕、功率密度高、能量利用效率高、響應(yīng)帶寬高、耐沖擊等等。其中,核心關(guān)節(jié)不僅是讓人形機器人更加靈活、更加自由的關(guān)鍵,也是未來實現(xiàn)規(guī)模量產(chǎn)、低成本制造的重要門檻之一,稚暉君在現(xiàn)場解釋說。為了實現(xiàn)這些目標(biāo),智元團隊自研、設(shè)計了一款專用關(guān)節(jié) ——PowerFlow。這個關(guān)節(jié)采用了準(zhǔn)直驅(qū)的方案,它的優(yōu)點是功率高、不需要傳感器(可以用電機電流判斷力矩),通過電流直接做力矩控制,價格低。為了增加功率密度,遠(yuǎn)征 A1 的關(guān)節(jié)模組還集成了液冷循環(huán)散熱系統(tǒng)。搭配上自研的一體化矢量驅(qū)動控制器,整個關(guān)節(jié)的峰值扭矩可以達(dá)到 350Nm。不過,稚暉君表示,他們還沒有測到扭矩的真正上限,估計潛力比想象中高。而且,由于水冷散熱的加持,它可以保持更長時間的峰值扭距輸出,而重量僅為 1.6 公斤。

fca4f87a-3dae-11ee-ac96-dac502259ad0.jpg

這個關(guān)節(jié)還有個非常有意思的設(shè)計,它讓機器人的膝關(guān)節(jié)向后彎曲,而不是和人一樣向前。稚暉君解釋說,這是為了讓機器人干活更加方便,畢竟再好的人造關(guān)節(jié)也不可能讓機器人像人一樣那么靈活,反屈膝關(guān)節(jié)的設(shè)計可以讓它擁有更大的操作空間。

fcd38adc-3dae-11ee-ac96-dac502259ad0.png

自研靈巧手 SkillHand
要想讓機器人更好地干活,手是另外一個關(guān)鍵部件,因此智元研發(fā)了靈巧手 SkillHand。這個靈巧手有 12 個主動自由度、5 個被動自由度,而且所有驅(qū)動都是內(nèi)置的。考慮到這個靈巧手未來將面對精密制造場景,智元在它的指尖安裝了一些傳感器。其中,視覺傳感器可以分辨操作物的顏色、材質(zhì)。基于各種算法的數(shù)據(jù)融合,指尖還可以做到近似的觸覺壓力傳感器效果。由于這些傳感器可以幫助機器人實現(xiàn)末端的視覺閉環(huán),整機的電機精度需求得以降低。有意思的是,如果場景需要,這個機器人其實可以自主更換靈巧手,比如把手換成螺絲刀。稚暉君說,這是模塊化設(shè)計思想在他們機器人中的體現(xiàn)。類似的模塊化設(shè)計還可以讓機器人由腿式變成輪式,「這是它通用性的一個體現(xiàn)」。

fd1d140e-3dae-11ee-ac96-dac502259ad0.jpg

全套 AI 框架

如何讓通用機器人實現(xiàn)低成本量產(chǎn),產(chǎn)生實際應(yīng)用價值?稚暉君表示,硬件只是前提條件之一,更重要的其實是背后的機器人大腦。在當(dāng)前的具身智能領(lǐng)域,很多研究都在嘗試將大模型作為機器人的大腦,稚暉君也不例外,他也想用多模態(tài)大模型的能力賦能智元機器人的行為動作編排。在智元機器人上個月發(fā)布的一個視頻中,我們已經(jīng)看到了這個想法的初步實現(xiàn),比如給出自然語言指令「把離你最近的木塊放到紫色的方塊右邊 3 厘米」,機器人就會按照指示行動。

稚暉君把這個機器人背后的大模型叫做 WorkGPT,這是一個百億級參數(shù)的大模型。fdb5639e-3dae-11ee-ac96-dac502259ad0.pngfe1bb77a-3dae-11ee-ac96-dac502259ad0.png在稚暉君看來,語言和圖像大模型對于機器人領(lǐng)域應(yīng)用最大的價值在于兩個方面,一是龐大的先驗知識庫和強大的通識理解能力,比如你不用告訴它什么是垃圾,它就能自己分辨出來;二是復(fù)雜的語義多級推理能力,即所謂的「思維鏈」,這體現(xiàn)在它可以把復(fù)雜的指令分成一個一個的步驟。「在大模型時代到來之前,機器人都是專用設(shè)備,我們需要針對性地對每一個任務(wù)進行調(diào)試和部署。現(xiàn)在利用大模型的各種通識能力和舉一反三的推理能力,我們可以看到解決這些問題,然后最終走向通用機器人的一道曙光。」稚暉君說。所以,在智元,他們打造了一個名為 EI-Brain 的具身智腦框架。在框架中,機器人系統(tǒng)被分為不同層級,包括部署在云端的超腦,部署在端側(cè)的大腦、小腦以及腦干,分別對應(yīng)機器人任務(wù)不同級別的技能,包括技能級、指令級、伺服級等。具體來說,「大腦」負(fù)責(zé)跟我們?nèi)祟愐粯舆M行抽象思考、多級推理,「小腦」負(fù)責(zé)運動控制方面的一些指令生成,「腦干」負(fù)責(zé)電機控制、伺服等硬件底層任務(wù)。

fe81f1ca-3dae-11ee-ac96-dac502259ad0.jpg

如果端側(cè)模型泛化能力不夠,系統(tǒng)可以去連接云端,實現(xiàn)更復(fù)雜的任務(wù)調(diào)度;另一方面,偏向于硬件底層的電機控制等工作都在本地甚至模塊中完成。「這類似于自動駕駛上 L1 到 L5 的不同分級 —— 想要構(gòu)建全場景通用的智能機器人,存在不同的發(fā)展階段,」稚暉君表示。「我們定義了一系列 Meta skill,在語言操作庫范圍限定的有限泛化的場景內(nèi),機器人可以實現(xiàn)自主的推理決策,然后完成端到端的任務(wù)編排。隨著能力庫不斷擴充,機器人能夠勝任的任務(wù)空間也將指數(shù)級增長,最終可以實現(xiàn)全場景的覆蓋,切入千行百業(yè)。這體現(xiàn)了具身智能在交互和學(xué)習(xí)中進化成長的邏輯。」為了讓這些層級起作用,智元不止在大模型方面展開了探索,還迭代了其他方面的算法。比如,在運動控制算法方面,他們在幾個月的時間里進行了多次迭代,一直迭代到最近使用的非線性的 NMPC,以及目前正在開發(fā)中的基于各種 learning (比如強化學(xué)習(xí))的方法。

fea958b4-3dae-11ee-ac96-dac502259ad0.png

同時,他們也在搭建一個用于離線軌跡優(yōu)化的動作庫平臺。

fef17658-3dae-11ee-ac96-dac502259ad0.png

未來,他們還將建立一個開放平臺,為開發(fā)者提供持續(xù)的技術(shù)支持、資金獎勵以及合作的機會,而且鼓勵開發(fā)者基于智元的機器人平臺去開發(fā)各種創(chuàng)新的應(yīng)用功能和解決方案。未來,這個開放平臺會包含整個機器人的開發(fā)套件,包括 HDK、SDK、基于中間件 AGi ROS仿真平臺,以及一些基礎(chǔ)的預(yù)訓(xùn)練大模型等等。同時他們也會去考慮推出一個低成本的教育版的硬件,供大家去進行二次開發(fā)。

ff4a4166-3dae-11ee-ac96-dac502259ad0.png

未來要賣 20 萬以內(nèi)

公司成立半年不到就發(fā)布第一款樣機,還具備完整的體系,讓人們不由得感嘆現(xiàn)在 AI 領(lǐng)域創(chuàng)業(yè)公司速度之快。更重要的是,智元機器人并不是一味在追求前沿技術(shù)探索,而是「所有產(chǎn)品都在為商業(yè)落地服務(wù)」。發(fā)布會上稚暉君表示,希望能把整機成本控制在 20 萬元以內(nèi),使其具備落地的條件,并計劃在遠(yuǎn)征 A1 發(fā)布后,以此為基礎(chǔ)馬上推出第一代商用產(chǎn)品。商業(yè)化也已經(jīng)有了相對具體的方向:基于當(dāng)前的人形機器人技術(shù),公司已在與國內(nèi)新能源頭部車企商討合作。希望在汽車制造總裝線、分裝線等場景上進行商用化落地的嘗試,另外也在和 3C 制造的大廠研究合作。智元機器人還計劃在未來幾年里把人形機器人推廣到更多領(lǐng)域。在消費級市場,人形機器人預(yù)計可適用的方式包含烹飪、家政、家庭護理、康復(fù)訓(xùn)練等。智元機器人(AGIBOT)成立于 2023 年 2 月,目前融資已經(jīng)完成了四輪,投資方包括高領(lǐng)、百度等風(fēng)投機構(gòu)。說到公司未來的發(fā)展,智元計劃逐步開放開發(fā)平臺,在未來以每年一代的速度迭代新的樣機產(chǎn)品,并不斷進行商用驗證。稚暉君也表示,為了支持計劃,公司即將開啟秋招。ff779288-3dae-11ee-ac96-dac502259ad0.png智元機器人投身的具身智能當(dāng)前是一個熱門領(lǐng)域。谷歌、斯坦福、英偉達(dá)等國際科技機構(gòu)都在這方面展開了研究,并在近期展示了他們的具身智能機器人成果。今年 3 月份,一家名為 1X 的具身智能機器人公司還拿到了 OpenAI 的投資。隨著稚暉君等國內(nèi)外優(yōu)秀人才的快速進場,或許我們很快就能看到行業(yè)內(nèi)出現(xiàn)顛覆性的應(yīng)用。「我的夢想是有一天能夠真正造出科幻電影中的智能機器人,它不再是簡單的機械裝置,而是擁有自主思考和學(xué)習(xí)能力的智能伙伴,能夠感知、理解我們的世界,并與我們深入溝通,」稚暉君說道。「遠(yuǎn)征 A1 的發(fā)布,只是我們追求的起點。」

3. 釘釘個人版開放內(nèi)測:無打卡、無已讀 提供一站式AI服務(wù)

原文:https://news.mydrivers.com/1/929/929366.htm
快科技8月16日消息,根據(jù)釘釘官網(wǎng)顯示,全新的釘釘個人版已經(jīng)正式啟動內(nèi)測,所有用戶都可在官網(wǎng)申請加入內(nèi)測。據(jù)了解,釘釘個人版,主要面向小團隊、個人用戶、高校大學(xué)生等人群,旨在探索每個個體、每個團隊的數(shù)字生產(chǎn)力工具,讓智能化變革普惠每一個個體,AI人人可用。

加入內(nèi)測后,用戶可搶先體驗各類AI服務(wù),目前文生文、文生圖、角色化對話以及AI創(chuàng)作等服務(wù)均限時免費。值得一提的是,釘釘個人版并沒有常規(guī)的打卡和消息已讀顯示功能,對個人用戶來說更加友好

fffa5f24-3dae-11ee-ac96-dac502259ad0.png

內(nèi)測版本僅有空間、AI、云盤、會議4項功能,產(chǎn)品將以AI為核心,用戶可一站獲取類似ChatGPT、Midjourney、Notion AI等各類大模型能力,并提供“賈維斯”文生文 AI 和“繆斯”文生圖 AI。釘釘個人版負(fù)責(zé)人表示,除了支持升級會員版本提高功能權(quán)益外,釘釘個人版在商業(yè)化設(shè)計方面,也將率先推出“算粒”這一AI服務(wù)的計量單位,用戶使用 AI 問答、AI 圖片將會消耗不同數(shù)量的算粒,消耗完之后將只能使用免費的限額次數(shù),或者增購算粒。

0033e532-3daf-11ee-ac96-dac502259ad0.png

4. GPT-4數(shù)學(xué)再提30分,代碼解析器任督二脈被打開,網(wǎng)友:像大腦的工作方式

原文:https://www.thepaper.cn/newsDetail_forward_24270135
GPT-4數(shù)學(xué)能力還能更強!新研究發(fā)現(xiàn)GPT-4代碼解釋器做題準(zhǔn)確率與其使用代碼的頻率有關(guān)。為此,研究人員提出新方法對癥下藥,直接將其數(shù)學(xué)能力拔至新SOTA:在MATH數(shù)據(jù)集上,做題準(zhǔn)確率從53.9%增加到了84.3%。

你沒聽錯,就是前段時間被稱為ChatGPT推出后最強模式的那個代碼解析器(Code Interpreter)。研究人員窺探了其代碼生成和執(zhí)行機制,使用自我驗證、驗證引導(dǎo)加權(quán)多數(shù)投票的方法,直接打開其做數(shù)學(xué)題的任督二脈。好奇網(wǎng)友隨即而來:還想看他們做高數(shù)。

00802f3c-3daf-11ee-ac96-dac502259ad0.jpg

還有網(wǎng)友認(rèn)為:這也就是大腦的工作方式,人類在解決數(shù)學(xué)問題時也會自我驗證。

009d51de-3daf-11ee-ac96-dac502259ad0.jpg

一起來康康這項研究的細(xì)節(jié)~兩步提升數(shù)學(xué)能力GPT-4代碼解析器的代碼生成和執(zhí)行機制究竟是怎樣的?來自港中文MMLab、南京大學(xué)、中科大、清華、城大、長沙理工等多個機構(gòu)的學(xué)者為解開這一問題,使用特定代碼約束提示進行了一項試驗。

00b9a85c-3daf-11ee-ac96-dac502259ad0.jpg

他們設(shè)計了3種不同的提示方法,限制GPT-4代碼解析器使用代碼的頻率:Prompt 1:完全不允許使用代碼,輸出完全依賴自然語言推理,禁止將代碼合并到解決方案中。Prompt 2:只允許使用1次代碼,也就是在生成解決方案時,只能在單個代碼塊內(nèi)使用代碼。Basic Prompt:沒有限制,GPT-4代碼解析器可以進行一系列推理步驟,每個步驟都可由文字+Python代碼組成。

00e41db2-3daf-11ee-ac96-dac502259ad0.jpg

△(a)不同提示回答準(zhǔn)確率比較(b)代碼使用頻率與五個難度級別準(zhǔn)確率都成比例,這種現(xiàn)象在數(shù)學(xué)問題相對復(fù)雜時尤為明顯。結(jié)果發(fā)現(xiàn),允許GPT-4代碼解析器多次生成和執(zhí)行代碼,其解題正確度明顯高于僅用自然語言推理或只用1次代碼的情況。經(jīng)分析,研究人員認(rèn)為代碼的多次生成和執(zhí)行可以讓GPT-4代碼解析器逐步完善解決方案,當(dāng)代碼執(zhí)行產(chǎn)生錯誤時,GPT-4代碼解析器可以自我調(diào)試修改方案。繼而引入“代碼使用頻率”概念,量化不同提示方法下代碼的使用次數(shù)。基于前面的分析結(jié)果,研究人員希望能加強GPT-4代碼解析器生成準(zhǔn)確代碼、評估代碼執(zhí)行結(jié)果以及自動調(diào)整解決方案的能力。所以提出了CSV(自我驗證)提示的方法,也就是為解決方案C引入了一個額外的驗證階段,稱為V。加入自我驗證提示效果對應(yīng)上圖綠色Verification Prompt。如此一來,GPT-4代碼解析器需額外生成代碼來驗證答案,如果結(jié)果是False則重新推理得到正確答案。

0106551c-3daf-11ee-ac96-dac502259ad0.jpg

CSV提示不僅對驗證到邏輯推理每一步都進行了擴展,而且可以自動更正錯誤,無需外部模型或人工參與。

011c2f72-3daf-11ee-ac96-dac502259ad0.jpg

△MATH數(shù)據(jù)集中第712個中級代數(shù)問題。CSV prompt:To solve the problem using code interpreter step by step, and please verify your answer using code interpreter.通過上圖這個例子可看出,在沒有自我驗證的情況下,模型生成了一個錯誤的答案。通過自我驗證,模型糾正了錯誤并生成了正確的答案。此外,鑒于CSV可以有效地驗證問題的答案,研究人員又提出了驗證引導(dǎo)加權(quán)多數(shù)投票(VW-voting)的方法,將自我驗證結(jié)果集成到多數(shù)表決中,給予不同驗證狀態(tài)不同權(quán)重,使表決更可靠。

014a89e4-3daf-11ee-ac96-dac502259ad0.jpg

在實際操作中,一旦一個答案被確認(rèn)為錯誤,那就不會進行額外的驗證,從而得到一個錯誤的驗證狀態(tài)。研究人員分配相應(yīng)的權(quán)重給這些狀態(tài):真實(wT)、不確定(wU)和錯誤(wF)。

01787fa2-3daf-11ee-ac96-dac502259ad0.jpg

最后從候選答案中擇取得分最高的那一個:

018c3c86-3daf-11ee-ac96-dac502259ad0.jpg

比此前最高水平提高30%用上了上述方法,GPT-4代碼解析器做數(shù)學(xué)題的能力up up。在MATH數(shù)據(jù)集上,原始GPT-4代碼解析器的準(zhǔn)確率為69.69%,使用CSV提示后提高到73.54%,再結(jié)合加權(quán)多數(shù)表決后進一步提高到84.32%,相比之前SOTA提高了30%以上。

019da58e-3daf-11ee-ac96-dac502259ad0.jpg

△在MATH數(shù)據(jù)集上的準(zhǔn)確率(%)在MATH數(shù)據(jù)集的各個子任務(wù)中,提出方法均取得顯著提高,尤其是在高難度級別的題目中效果更明顯。例如在中級代數(shù)(Intermediate Algebra)題目中,原來的GPT-4代碼解析器準(zhǔn)確率為50.1%,使用新方法后提高到74.4%。除此之外,研究人員還在GSM8K、MMLU-Math、MMLU-STEM等數(shù)據(jù)集上進行了驗證。

01c6acf4-3daf-11ee-ac96-dac502259ad0.jpg

△在GSM8K數(shù)據(jù)集上的表現(xiàn)上表可以看出,使用驗證引導(dǎo)加權(quán)多數(shù)投票的方法還可以顯著減少需要采樣的解路徑數(shù)量(Sampled paths),在GSM8K數(shù)據(jù)集上只需要5個路徑就達(dá)到97%的準(zhǔn)確率。

01ddd44c-3daf-11ee-ac96-dac502259ad0.jpg

△在MMLU數(shù)據(jù)集上的表現(xiàn)針對不同難度的題目(下圖a)以及不同類型題目(下圖b)的測試中,使用新方法后準(zhǔn)確率都有了提升。

01f7fe08-3daf-11ee-ac96-dac502259ad0.jpg

△每條曲線上的四個點分別對應(yīng)于使用Prompt 1、Prompt 2、BasicPrompt、CSV Prompt得到的結(jié)果。研究人員還發(fā)現(xiàn)GPT-4代碼解析器的代碼使用頻率提高與準(zhǔn)確率提高正相關(guān)。隨著題目難度的增加,代碼使用頻率穩(wěn)步上升。這說明在較難的數(shù)學(xué)問題上,更頻繁地使用代碼很重要。此外,值得注意的是,盡管添加基于代碼的自我驗證可以提高每個單獨題目類型的性能,但改進的程度也因題目類型而異,從7.6%到僅0.6%不等。研究人員指出:特別是幾何問題的準(zhǔn)確性僅提高了0.6%,原本GPT-4代碼解析器的準(zhǔn)確性也只有54.0%,在各個題目類型中屬于較低的。這種差異可能是因為解決幾何問題通常需要多模態(tài),超出了本文研究范圍。論文傳送門:https://arxiv.org/abs/2308.07921參考鏈接:[1]https://twitter.com/_akhaliq/status/1691734872329699813?s=20[2]https://x.com/justfannet/status/1691983780498600376?s=46&t=iTysI4vQLQqCNJjSmBODPw

5. 數(shù)學(xué)能力超ChatGPT,70B開源大模型火了:用AI微調(diào)AI,微軟全華班出品

原文:https://www.thepaper.cn/newsDetail_forward_24224649
用AI生成的指令微調(diào)羊駝大模型,數(shù)學(xué)能力超ChatGPT——微軟最新開源大模型WizardMath來了。

020bab9c-3daf-11ee-ac96-dac502259ad0.jpg

如下圖所示,經(jīng)過GSM8k數(shù)據(jù)集測試,WizardMath數(shù)學(xué)能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——并且是在參數(shù)只有700億,遠(yuǎn)不及后三者的情況之下。

023434cc-3daf-11ee-ac96-dac502259ad0.jpg

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數(shù)),各種數(shù)學(xué)題可以直接丟進去試一試。比如解決下面這道四次多項式方程:

02659972-3daf-11ee-ac96-dac502259ad0.jpg

或者是一道簡單的微積分:

028ddf86-3daf-11ee-ac96-dac502259ad0.jpg

亦或者是稍微修改過的拉格朗日方程推導(dǎo):

02b05002-3daf-11ee-ac96-dac502259ad0.jpg

它都全部正確(過程也不需要等太久)。有網(wǎng)友向作者表示:效果真的很驚人,感謝你們對開源LLM的貢獻。

02cf37a6-3daf-11ee-ac96-dac502259ad0.jpg

目前,相關(guān)代碼、復(fù)現(xiàn)方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標(biāo)星。

02eebe46-3daf-11ee-ac96-dac502259ad0.jpg

那么,WizardMath究竟是如何做到的?用AI生成的指令增強大模型能力OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù),一部分原因是使用了真實人類用戶生成的開放域指令數(shù)據(jù)進行了微調(diào)。然而,不是誰都能像這家公司一樣獲得這樣的指令數(shù)據(jù)集。一是因為整個注釋過程極其昂貴且耗時,二是人工難以創(chuàng)建出足夠比例的高難度指令。因此,開發(fā)出一種成本相對較低的、大規(guī)模開放域指令自動生產(chǎn)方法,成為當(dāng)下指令調(diào)優(yōu)語言模型的關(guān)鍵。在此,作者將他們的方法命名為Evol Instruction。它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。具體而言,Evol Instruction分為指令進化器和指令消除器。其中指令進化器可通過深度進化(藍(lán)線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復(fù)雜的指令或創(chuàng)建一條全新指令。具體執(zhí)行哪一條?隨機選擇就好。

030d9bae-3daf-11ee-ac96-dac502259ad0.jpg

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復(fù)雜化(complicate input)。由于所有指令均由AI完成,有時難免會出現(xiàn)錯誤。因此,指令消除器就是用于過濾失敗指令的。以下是一個具體示例,該方法從“1+1=?”開始,最終通過以上步驟自動生成了相當(dāng)多的新指令。

032fba9a-3daf-11ee-ac96-dac502259ad0.jpg

通過重復(fù)這一生成過程,最終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎(chǔ)大模型進行微調(diào)了。在此,作者選擇Alpaca的訓(xùn)練數(shù)據(jù)(僅由175條人工創(chuàng)建的種子指令生成)作為初始數(shù)據(jù)集,然后使用ChatGPT的API執(zhí)行了四個進化周期,最終獲得25萬條指令。為了與Vicuna的70k真實用戶數(shù)據(jù)(ShareGPT)進行公平比較,作者從這25萬條數(shù)據(jù)中抽取了等量的樣本,訓(xùn)練LLaMA 7B模型,最終得到WizardLM,結(jié)果WizardLM的性能明顯優(yōu)于Vicuna。(Alpaca:斯坦福在LLaMa-7B基礎(chǔ)上微調(diào)出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎(chǔ)上微調(diào)得來)此外,在更為復(fù)雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復(fù)雜指令的能力。基于此,作者又利用Evol Instruction生成了很多數(shù)學(xué)領(lǐng)域相關(guān)的指令,然后微調(diào)羊駝大模型,得到了WizardMath。其效果如開頭所示,在GSM8k數(shù)據(jù)集上測得其數(shù)學(xué)能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數(shù)的Flan-PaLM 2之后。以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。

03635a4e-3daf-11ee-ac96-dac502259ad0.jpg

團隊介紹本文共9位作者,全華人。一作有3位:Can Xu,微軟亞洲互聯(lián)網(wǎng)工程院S+D NLP組高級應(yīng)用科學(xué)家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統(tǒng)工作;Qingfeng Sun, Microsoft Research科學(xué)家,研究方向為自然語言處理和信息檢索,精通構(gòu)建高效搜索系統(tǒng),為Microsoft Bing和Office 365貢獻了核心深度模型;Kai Zheng,Microsoft Research科學(xué)家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。0395f332-3daf-11ee-ac96-dac502259ad0.jpg

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學(xué)家,在微軟工作16年有余、曾作為微軟必應(yīng)搜索引擎和Cortana智能助手自然語言理解負(fù)責(zé)人,。

另還有一位作者Jiazhan Feng,是北大學(xué)生,這篇合著論文是TA在微軟實習(xí)時產(chǎn)出的。項目主頁:https://github.com/nlpxucan/WizardLM/tree/main/WizardMath論文地址:https://arxiv.org/abs/2304.12244(WizardLM)https://arxiv.org/abs/2306.08568(WizardCoder) ———————End——————


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • RT-Thread
    +關(guān)注

    關(guān)注

    32

    文章

    1370

    瀏覽量

    41524

原文標(biāo)題:【AI簡報20230818期】人形機器人問世:大模型加持;用AI微調(diào)AI,微軟全華班出品!

文章出處:【微信號:RTThread,微信公眾號:RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    人形之外,AI機器人的多元未來

    Transformer模型、大型語言模型以及基礎(chǔ)模型方面的突破,必要的技術(shù)已“近在眼前”。 ? 不過相比于仍然處于前期的人形機器人,其他的非
    的頭像 發(fā)表于 01-21 00:08 ?3294次閱讀
    <b class='flag-5'>人形</b>之外,<b class='flag-5'>AI</b><b class='flag-5'>機器人</b>的多元未來

    NVIDIA 通過云端至機器人計算平臺驅(qū)動人形機器人技術(shù),賦能物理 AI

    機器人推理與技能基礎(chǔ)模型的首次更新;用于合成運動生成的 NVIDIA Isaac GR00T-Dreams Blueprint;以及用于加速人形機器人開發(fā)的 NVIDIA Blackw
    發(fā)表于 05-19 17:53 ?875次閱讀
    NVIDIA 通過云端至<b class='flag-5'>機器人</b>計算平臺驅(qū)動<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>技術(shù),賦能物理 <b class='flag-5'>AI</b>

    大象機器人攜手進迭時空推出 RISC-V 棧開源六軸機械臂產(chǎn)品

    識別聯(lián)調(diào)。 進迭時空致力于為智能機器人提供完整棧優(yōu)化的RISC-V AI軟硬件解決方案,第一代RISC-V AI CPU芯片K1已完成AI
    發(fā)表于 04-25 17:59

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+初品Agent

    任務(wù)的數(shù)字員工。 可將其概括為: Agent=大模型+記憶+主動規(guī)劃+工具使用 可以這樣來理解它,Agent是一個執(zhí)行智能化處理的工具實體,但這種實體又有別于以具身機器人形式出現(xiàn)的類智能機器
    發(fā)表于 04-22 11:51

    讓智能遍布人形機器人全身,這家國產(chǎn)MCU企業(yè)探索MCU+AI(TinyML)

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在打造人形機器人方案時,多數(shù)人會把機器人的智能化能力與 AI模型劃等號。憑借高算力的
    的頭像 發(fā)表于 04-14 00:44 ?1470次閱讀
    讓智能遍布<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>全身,這家國產(chǎn)MCU企業(yè)探索MCU+<b class='flag-5'>AI</b>(TinyML)

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    基石。 Neuron Studio打造流程一站式開發(fā)體驗,為AI應(yīng)用開發(fā)按下加速鍵 AI 應(yīng)用的開發(fā)瓶頸,從來都不是“點的問題”,而是“鏈的問題”:開發(fā)工具碎片化,調(diào)優(yōu)過程靠手動,單模型
    發(fā)表于 04-13 19:52

    春晚后人形機器人升級,驚呆網(wǎng)友:中國的AI技術(shù)不可想象

    帶來了一場別開生面的視覺盛宴,更讓觀眾真切感受到人形機器人時代的腳步正越來越近。節(jié)目播出后,人形機器人的升級和表現(xiàn)引發(fā)了網(wǎng)友的一片驚嘆:“中國的AI
    的頭像 發(fā)表于 02-17 09:15 ?381次閱讀

    CES 2025|美格智能高算力AI模組助力“通天曉”人形機器人震撼發(fā)布

    機器人內(nèi)置美格智能基于高通QCS8550計算平臺開發(fā)的高算力AI模組SNM970,以強大AI算力+端側(cè)大模型部署能力,為人形
    的頭像 發(fā)表于 01-08 09:02 ?687次閱讀
    CES 2025|美格智能高算力<b class='flag-5'>AI</b>模組助力“通天曉”<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>震撼發(fā)布

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

    將大模型的\"大腦\"裝入物理實體的\"身軀\",讓AI真正走進現(xiàn)實世界。這種革新不僅體現(xiàn)在稚暉君開源的人形機器人方案,更在“AI教母”李飛
    發(fā)表于 12-19 22:26

    王耀南院士:AI模型賦能人形機器人及未來趨勢

    他以多個案例詳細(xì)介紹了AI模型賦能具身智能人形機器人的思路和方法,他提出未來在具身智能人形
    的頭像 發(fā)表于 11-08 11:03 ?1473次閱讀
    王耀南院士:<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>賦能<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>及未來趨勢

    小鵬汽車正式進軍人形機器人領(lǐng)域,發(fā)布AI機器人Iron

    在特斯拉之后,中國電動汽車制造商小鵬汽車也于11月6日正式進軍人形機器人領(lǐng)域。今日下午,小鵬汽車在廣州隆重發(fā)布了其自主研發(fā)的全新AI人形機器人
    的頭像 發(fā)表于 11-07 15:28 ?1147次閱讀

    利用NVIDIA技術(shù)推動下一代AI機器人發(fā)展

    人形機器人到工廠,基于物理 AI 的工業(yè)系統(tǒng)正在通過訓(xùn)練、仿真和推理加速發(fā)展。
    的頭像 發(fā)表于 10-27 09:54 ?580次閱讀

    Figure AI發(fā)布革新性人形機器人Figure 02

    在人工智能與機器人技術(shù)融合的浪潮中,F(xiàn)igure AI憑借其強大的技術(shù)實力和雄厚的資金支持,成功推出了新一代人形機器人——Figure 02,再次引領(lǐng)行業(yè)變革。這款
    的頭像 發(fā)表于 08-08 16:30 ?1120次閱讀

    英偉達(dá)打造人形機器人訓(xùn)練平臺,引領(lǐng)AI新紀(jì)元

    英偉達(dá)近日宣布了一項重大舉措,為全球機器人制造業(yè)與AI領(lǐng)域注入強勁動力。公司推出了專為人形機器人設(shè)計的訓(xùn)練平臺,旨在為行業(yè)領(lǐng)先的制造商、AI
    的頭像 發(fā)表于 08-05 11:45 ?1032次閱讀

    Al大模型機器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強介紹說,薩科微Al大模型機器人有哪些的優(yōu)勢?薩科微AI模型機器人由清華大學(xué)畢業(yè)的天才少年
    發(fā)表于 07-05 08:52