女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind又出AI大招

機器人技術與應用 ? 來源:機器人技術與應用 ? 作者:機器人技術與應用 ? 2021-03-11 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepMind 公司因為研制出會下棋的人工智能AlphaGo和AlphaZero而聲名鵲起,如今他們將注意力轉向了另一種棋盤游戲:強權外交(Diplomacy),也被稱為外交或者外交風云,是經(jīng)典的桌面游戲之一。該游戲與圍棋不同,它是七人游戲,需要游戲玩家既競爭又合作,并且每回合玩家都會同時進行移動,因此,每個玩家都必須推理其他玩家的想法,非常復雜。

研制一個能玩外交游戲的人工智能軟件,DeepMind公司的計算機專家Andrea Tacchetti表示:“與游戲Go或國際象棋相比,這是一個本質上不同的問題。” 去年12月,Tacchetti和合作者在NeurIPS會議上就其系統(tǒng)發(fā)表了一篇論文,該論文介紹了能玩外交游戲的AI系統(tǒng)策略。

“外交”是一種策略游戲,在歐洲地圖上劃分為75個省。玩家建立并動員軍隊占領各省,直到控制了大部分補給中心的玩家獲勝。玩家每回合寫下自己的行動,然后執(zhí)行。他們可以攻擊或防御對方玩家,或者支援對方玩家的進攻和防御,建立聯(lián)盟。在完整版中,玩家可以協(xié)商,為了方便人工智能研究,DeepMind公司使用了簡單版的“No Press”策略,不需要人工智能軟件發(fā)布策略與其他玩家進行溝通。

從歷史上看,人工智能使用人工制定的策略來發(fā)揮決策作用。2019年,蒙特利爾研究所的Mila通過使用深度學習系統(tǒng)取得了勝利。他們基于150000個人類游戲的數(shù)據(jù)集,訓練了一個稱為DipNet的神經(jīng)網(wǎng)絡來模仿人類。DeepMind從DipNet版本開始,使用強化學習(一種反復試驗)來完善它。但是,僅通過反復試驗來探索可能性會帶來問題。因此,他們調整了強化學習算法。在訓練過程中,他們在每一步中都對對手的可能舉動進行采樣,計算出在這些情況下平均效果最佳的行動,然后訓練自己的權重以偏向于此行動。經(jīng)過訓練,它跳過了采樣過程,僅根據(jù)其學習的知識進行工作。Tacchetti說:“我們論文的信息是:我們可以在這樣的環(huán)境中進行強化學習。” 他們設計的一個AI玩家與六個DipNet的AI贏了30%的時間(有14%的機會)。一個DipNet對抗他們的七個,僅贏得了3%的時間。

今年4月,F(xiàn)acebook將在ICLR會議上發(fā)表一篇論文,描述他們在“No Press”版本的外交游戲中的研究成果。他們建立了類似DipNet的網(wǎng)絡,但是沒有添加強化學習的元素,而是添加了一個“SearchBot”搜索玩家策略,SearchBot通過玩幾回合來評估玩家的每種潛在策略(假設每個人都根據(jù)神經(jīng)網(wǎng)絡的首選選擇后續(xù)行動)。策略不是一個最佳行動組合,而是由50個可能行動組成的一組概率(由神經(jīng)網(wǎng)絡建議)。

在真實游戲中進行這樣的探索會減慢SearchBot的速度,但可以使它更優(yōu)于DipNet。SearchBot在外交游戲網(wǎng)站上與人類進行了匿名比賽,在玩家中排名前2%。Facebook的計算機專家、論文的共同作者亞當·勒勒(Adam Lerer)說:“這是第一個被證明具有能與人類競爭的機器人。”

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49042

    瀏覽量

    249872
  • 強化學習
    +關注

    關注

    4

    文章

    269

    瀏覽量

    11611
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11606

原文標題:DeepMind又出AI大招

文章出處:【微信號:robotmagazine,微信公眾號:機器人技術與應用】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊
    發(fā)表于 07-09 18:30

    AI岸橋理貨系統(tǒng)高效精準

    AI
    jf_60141436
    發(fā)布于 :2025年05月30日 11:49:13

    湖南重大招商引資駐京工作專班蒞臨ALVA調研

    近日,湖南省央企對接合作暨重大招商引資駐京工作專班主任鄭建新一行赴 ALVA Systems 考察調研。
    的頭像 發(fā)表于 04-16 10:14 ?444次閱讀

    AI 時代開啟,企業(yè)跟風做 AI 產品是明智之舉?

    AI
    華成工控
    發(fā)布于 :2025年04月10日 17:28:44

    英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    、優(yōu)化能源電網(wǎng)等。在 NVIDIA GTC 全球 AI 大會上,來自 Google DeepMind、Isomorphic Labs、I
    的頭像 發(fā)表于 03-21 15:10 ?1173次閱讀
    英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    []() 2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新的高性能處理器
    發(fā)表于 03-19 17:54

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰(zhàn)》這本書學習如何構建開發(fā)一個視頻應用。AI Agent是一種智能應用,能夠根據(jù)用戶需求和環(huán)境變化做出相應響應。通常基于深度
    發(fā)表于 03-05 19:52

    求助,使用reality AI建立內容后,出現(xiàn)部分no reference to 的報錯

    將對應的predict文件導入后,出現(xiàn)了如下報錯 然后將自己生成的代碼放到官方發(fā)的那個姿態(tài)傳感的項目中又可以跑。 將官方的rai文件倒過來又出現(xiàn)no reference to 報錯
    發(fā)表于 02-14 20:48

    DeepMind創(chuàng)始人預計年內有AI設計藥物進入臨床試驗

    近日,英國人工智能公司DeepMind的創(chuàng)始人兼首席執(zhí)行官德米斯·哈薩比斯(Demis Hassabis)透露,預計在今年年底前,將有人工智能(AI)設計的藥物進入臨床試驗階段。
    的頭像 發(fā)表于 01-24 15:46 ?2217次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌已將AI Studio團隊整體轉移至DeepMi
    的頭像 發(fā)表于 01-13 14:40 ?723次閱讀

    谷歌Vertex AI助力企業(yè)生成式AI應用

    DeepMind 在模型技術方面積極探索創(chuàng)新,尤其著力于 Gemini 和 Imagen 的改進。我們的企業(yè) AI 平臺 Vertex AI 也推出了數(shù)十項突破性功能。
    的頭像 發(fā)表于 09-09 15:59 ?920次閱讀

    邊緣AI芯片市場升溫!英特爾、AMD出大招,本土芯片廠商爭發(fā)新品

    邊緣 AI 是指在邊緣設備(例如智能手機、物聯(lián)網(wǎng)設備和嵌入式系統(tǒng))上實現(xiàn) AI 算法,而不是依賴于基于云的基礎設施。AI手機和AI PC等邊緣AI
    的頭像 發(fā)表于 08-01 00:17 ?5873次閱讀
    邊緣<b class='flag-5'>AI</b>芯片市場升溫!英特爾、AMD出<b class='flag-5'>大招</b>,本土芯片廠商爭發(fā)新品