女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開辟新篇章!谷歌機器學習又有新進展!

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-22 11:16 ? 次閱讀

在谷歌最新的論文中,研究人員提出了“非政策強化學習”算法OPC,它是強化學習的一種變體,它能夠評估哪種機器學習模型將產生最好的結果。數據顯示,OPC比基線機器學習算法有著顯著的提高,更加穩健可靠。

在谷歌AI研究團隊一篇新發表的論文《通過非政策分類進行非政策評估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他們提出了所稱的“非政策分類”,即OPC(off-policy classification)。它能夠評估AI的表現,通過將評估視為一個分類問題來驅動代理性能。

研究人員認為他們的方法是強化學習的一種變體,它利用獎勵來推動軟件政策實現與圖像輸入協同工作這個目標,并擴展到包括基于視覺的機器人抓取在內的任務。

“完全脫離政策強化學習是一種變體。代理完全從舊數據中學習,對于工程師來說這是很有吸引力的,因為它可以在不需要物理機器人的情況下進行模型迭代。”

Robotics at Google(專注機器學的的谷歌新團隊)的軟件工程師Alexa Irpan寫道,“完全脫離政策的RL,可以在先前代理收集的同一固定數據集上訓練多個模型,然后選擇出最佳的那個模型。”

但是OPC并不像聽起來那么容易,正如Irpan在論文中所描述的,非政策性強化學習可以通過機器人進行人工智能模型培訓,但不能進行評估。并且在需要評估大量模型的方法中,地面實況評估通常效率太低。

OPC在假設任務狀態變化方面幾乎沒有隨機性,同時假設代理在實驗結束時用“成功或失敗”來解決這個問題。兩個假設中第二個假設的二元性質,允許為每個操作分配兩個分類標簽(“有效”表示成功或“災難性”表示失敗)。

另外,OPC還依賴Q函數(通過Q學習算法學習)來估計行為的未來總回報。代理商選擇具有最大預期回報的行動,其績效通過所選行動的有效頻率來衡量(這取決于Q函數如何正確地將行動分類為有效與災難性),并以分類準確性作為非政策評估分數。

(左圖為基線,右圖為建議的方法之一,SoftOpC)

谷歌AI團隊使用完全非策略強化學習對機器學習策略進行了模擬培訓,然后使用從以前的實際數據中列出的非策略分數對其進行評估。

在機器人抓取任務時,他們報告OPC的一種變體SoftOPC在預測最終成功率方面表現最佳。假設有15種模型(其中7種純粹在模擬中訓練)具有不同的穩健性,SoftOPC產生的分數與與真正的抓取成功密切相關,并且相比于基線方法更加穩定可靠。

在未來的研究中,研究人員打算用“噪聲”(noisier)和非二進制動力學來探索機器學習任務。“我們認為這個結果有希望應用于許多現實世界的RL問題,”Irpan在論文結尾寫道。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6223

    瀏覽量

    107519
  • 機器學習
    +關注

    關注

    66

    文章

    8490

    瀏覽量

    134080
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    百度在AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度在AI領域的新進展
    的頭像 發表于 04-30 10:14 ?367次閱讀

    谷歌Gemini API最新進展

    體驗的 Live API 的最新進展,以及正式面向開發者開放的高質量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發表于 04-12 16:10 ?831次閱讀

    國產首款量產型七位半萬用表!青島漢泰開啟國產高精度測量新篇章

    國產首款量產型七位半萬用表!青島漢泰開啟國產高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數字萬用表。HDM3075系列是國產首款實現量產的七位半萬用表產品,它
    發表于 04-01 13:15

    微軟攜手長虹佳華開啟AI視頻廣告行業新篇章

    近日,微軟重磅發布了新的AI視頻廣告解決方案,并與長虹佳華在AI視頻廣告領域達成戰略合作。雙方共同舉辦了“數智創翼,生態領航”戰略合作啟動儀式,攜手開啟廣告行業的新篇章
    的頭像 發表于 02-26 11:06 ?590次閱讀

    智慧路燈:點亮城市,智慧公交站臺開啟智慧新篇章

    智慧路燈:點亮城市,智慧公交站臺開啟智慧新篇章
    的頭像 發表于 02-11 13:40 ?339次閱讀
    智慧路燈:點亮城市,智慧公交站臺開啟智慧<b class='flag-5'>新篇章</b>

    FF將發布FX品牌最新進展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發布以來的最新進展,包括最新項目進展、重大里程碑、新產品品類戰略及下一步計劃。
    的頭像 發表于 01-03 15:58 ?531次閱讀

    比亞迪與華工科技開啟戰略合作新篇章

    近日,比亞迪半導體事業部與華工科技高理公司、激光公司開展座談交流,開啟戰略合作新篇章
    的頭像 發表于 12-10 14:45 ?681次閱讀

    魏德米勒開啟產業數智轉型新篇章

    隨著制造業向高端、智能、綠色方向不斷邁進,以科技創新提質增效,貼近客戶挖掘深度需求,成為助力產業發展的重要錨點。11月,工業聯接專家魏德米勒的腳步加“數”出發 ,與客戶及合作伙伴共同開啟產業數智轉型新篇章
    的頭像 發表于 11-22 15:00 ?573次閱讀

    IOT物聯網中臺:開啟智慧生活新篇章 物聯網平臺系統

    IOT物聯網中臺:開啟智慧生活新篇章 物聯網平臺系統
    的頭像 發表于 11-19 09:14 ?658次閱讀

    揚帆出海!穩石氫能AEM電解槽出貨智利,開啟全球商業化新篇章

    繼國內商業化獲得突破之后,此次海外訂單的交付,標志著穩石氫能正式開啟了AEM制氫設備全球商業化的新篇章
    的頭像 發表于 11-01 10:31 ?556次閱讀
    揚帆出海!穩石氫能AEM電解槽出貨智利,開啟全球商業化<b class='flag-5'>新篇章</b>!

    重慶市第五人民醫院引領醫療電能質量革命,點亮“健康”新篇章

    重慶市第五人民醫院引領醫療電能質量革命,點亮“健康”新篇章
    的頭像 發表于 10-14 15:36 ?623次閱讀
    重慶市第五人民醫院引領醫療電能質量革命,點亮“健康”<b class='flag-5'>新篇章</b>

    摩爾線程與中國移動攜手,共筑生態與應用開創數智新篇章

    時代的新篇章。   摩爾線程,作為中國移動投資的國產全功能GPU企業,同時也是中國移動的重要生態伙伴,在本次大會上展示了其全棧AI產品及解決方案,并在中國移動股權投資展位精彩亮相。此外,摩爾線程還積極參與了多個論壇活動,展示了與中國移動在多維度合作中的創新成果與最新進展
    的頭像 發表于 10-14 15:36 ?1041次閱讀

    復合機器人:開啟智能倉儲新篇章

    隨著工業4.0時代的到來,智能制造和智能倉儲已經成為企業發展的重要驅動力。近日,一種全新的復合機器人倉庫搬運方案亮相,該方案以復合機器人AMR為核心,通過與搬運機器人AGV的緊密配合,開啟了智能倉儲的
    的頭像 發表于 10-12 16:58 ?563次閱讀
    復合<b class='flag-5'>機器</b>人:開啟智能倉儲<b class='flag-5'>新篇章</b>

    阿里巴巴AI賦能海外擴張新篇章

    中國電商巨頭阿里巴巴集團正積極重啟并加速其海外擴張戰略,以應對國內電商市場競爭加劇的挑戰。此次擴張的一大亮點在于,阿里巴巴將人工智能(AI)技術深度融入其國際業務布局中,開啟了海外發展的新篇章
    的頭像 發表于 07-12 17:56 ?1275次閱讀

    探索未來智能制造新篇章——富唯智能復合機器

    在科技飛速發展的今天,智能制造已成為推動產業升級的重要引擎。富唯智能憑借其在AI和機器人技術領域的深厚積累,推出了革命性的富唯智能復合機器人,開啟了智能制造的新篇章
    的頭像 發表于 06-20 17:35 ?784次閱讀
    探索未來智能制造<b class='flag-5'>新篇章</b>——富唯智能復合<b class='flag-5'>機器</b>人