女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們不是嫌棄世界冠軍OG團(tuán)隊(duì)實(shí)力太水嗎?“你行你上”的機(jī)會(huì)來了

電子工程師 ? 來源:lp ? 2019-04-22 13:43 ? 次閱讀

你們不是嫌棄世界冠軍 OG 團(tuán)隊(duì)實(shí)力太水嗎?“你行你上”的機(jī)會(huì)來了。

4 月 14 日凌晨,OpenAI Five 以 2:0 擊敗了 DOTA 世界冠軍團(tuán)隊(duì) OG 引發(fā)熱議。比賽當(dāng)天,OpenAI 也宣布要開放 OpenAI Five 競(jìng)技場(chǎng)模式,讓每個(gè)感興趣的人都參與其中。

4 月 18 日(太平洋標(biāo)準(zhǔn)時(shí)間)下午 6 點(diǎn),OpenAI 如約開放了這一模式,全世界各路玩家都可以免費(fèi)進(jìn)行體驗(yàn)。開放時(shí)間為期三天,4 月 21 日(太平洋標(biāo)準(zhǔn)時(shí)間)晚上 11 點(diǎn) 59 分關(guān)閉,要體驗(yàn)一把人機(jī)對(duì)戰(zhàn)的話可得抓緊時(shí)間。

參賽鏈接:https://arena.openai.com/#/

目前從其官網(wǎng)賽況來看,截止今天早上 10 點(diǎn),OpenAI Five 與參與者打了 424 場(chǎng)比賽,AI 以 112-0 完勝人類玩家。

以下是人類參與者的部分賽況:

據(jù) OpenAI 官方介紹,參與者可以在競(jìng)爭(zhēng)模式和合作模式下體驗(yàn) OpenAI Five。他們的 1v1 機(jī)器人可以通過巧妙的策略加以利用,但他們也并不知道 OpenAI Five 能在多大程度上可以做到這一點(diǎn)。

在此前決賽中,他們展示了 OpenAI Five 和人類在合作模式打游戲。一組是 Sheever、Blitz 和三個(gè) OpenAI Five,對(duì)手是由 Capitalist、ODPixel 和三個(gè) OpenAI Five 組成的團(tuán)隊(duì)。

不過,通過 OpenAI Five 在決賽上的表現(xiàn),OpenAI 團(tuán)隊(duì)在最新的博客中分享了兩個(gè)驚喜:

盡管訓(xùn)練 OpenAI Five 系統(tǒng)的目的是為了打敗其他機(jī)器人,但他們卻發(fā)現(xiàn) OpenAI Five 其實(shí)還有與人類成為隊(duì)友的基本能力,也就是說可以將一個(gè)競(jìng)爭(zhēng)型 AI 變?yōu)楹献餍?AI。他們認(rèn)為,如果能更努力去開發(fā),未來 AI 系統(tǒng)能為人類做出非常多的貢獻(xiàn)。

4 月 18 日 到 21 日的競(jìng)技場(chǎng)模式測(cè)試將回答一個(gè)很重要的研究問題——OpenAI Five 的潛能可以被人類運(yùn)用到何種程度,或者它們?cè)谄渌男┓矫姹囟〞?huì)被打敗。OpenAI Five 這一深度強(qiáng)化學(xué)習(xí)智能體系統(tǒng),可能會(huì)成為有史以來人類能與之交互的最大的 AI 部署系統(tǒng)。

OG戰(zhàn)隊(duì)與OpenAI開發(fā)團(tuán)隊(duì)

對(duì)于 OpenAI Five 競(jìng)技場(chǎng)模式,有很多人報(bào)以期待,reddit 上有網(wǎng)友評(píng)論稱,“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經(jīng)要求要在網(wǎng)上跟機(jī)器人玩游戲了,現(xiàn)在它真的發(fā)生了!”

只是,如果在競(jìng)爭(zhēng)模式跟 AI 打 DOTA,作為人類玩家的你會(huì)不會(huì)慘遭OpenAI Five 的虐殺,而輸?shù)煤翢o懸念呢?祝你們好運(yùn)。

當(dāng)然,玩游戲之余,你可能也想知道:OpenAI Five 取得勝利背后的“秘訣”是什么?為什么這次的 OpenAI Five 系統(tǒng)要比去年在 TI 表演賽上敗給人類的AI系統(tǒng)更強(qiáng)?OpenAI 是如何訓(xùn)練 OpenAI Five 系統(tǒng)的?OpenAI 團(tuán)隊(duì)最近給出了解讀。

為什么是 DOTA2?

一開始,OpenAI 團(tuán)隊(duì)研究 OpenAI Five 是為了解決超出現(xiàn)有深度強(qiáng)化學(xué)習(xí)算法能力范圍的問題,他們希望通過現(xiàn)有的方法解決當(dāng)下無法解決的問題,原以為這需要復(fù)雜的算法思想(比如分層強(qiáng)化學(xué)習(xí)(Hierarchical RL)),但他們驚訝地發(fā)現(xiàn)只需要改進(jìn)的是規(guī)模,但實(shí)現(xiàn)和利用這個(gè)規(guī)模并不容易,這成了其研究的主要內(nèi)容。

OpenAI Five 把世界看作是一串必須破譯的數(shù)字。無論這些數(shù)字是以 DOTA 游戲形式(約 20000 個(gè)數(shù)字),還是以機(jī)械手形式(約 200 個(gè)),使用的都是通用學(xué)習(xí)代碼。

為了創(chuàng)建 OpenAI Five,OpenAI 團(tuán)隊(duì)創(chuàng)造了一個(gè)名為 Rapid 的系統(tǒng),用來以從未有過的規(guī)模去運(yùn)行 PPO(Proximal Policy Optimization),結(jié)果出人意料,居然創(chuàng)造了一個(gè)不受任何基本性能限制的世界級(jí) DOTA 機(jī)器人。

如今,RL 算法表現(xiàn)出了驚人的能力,但它在游戲或模擬環(huán)境之外卻用處不大,但這個(gè)限制可能并沒有聽起來的那么糟糕,例如可以使用 Rapid 來控制機(jī)械手來重新移動(dòng)一個(gè)模塊,這需要首先進(jìn)行模擬訓(xùn)練,然后在物理機(jī)器人上執(zhí)行。他們認(rèn)為,對(duì)于 RL 的下一個(gè)挑戰(zhàn)是減少對(duì)經(jīng)驗(yàn)的依賴。

雖然他們決定不再讓 OpenAI Five 成為競(jìng)爭(zhēng)對(duì)手,但社會(huì)進(jìn)步和技術(shù)發(fā)展將繼續(xù)推動(dòng)未來的研究,這也并非 DOTA 比賽研究的終點(diǎn),他們認(rèn)為 DOTA 比賽對(duì) RL 開發(fā)來說是一個(gè)比現(xiàn)在使用的標(biāo)準(zhǔn)環(huán)境更有趣、更復(fù)雜、也更好理解的環(huán)境。

算力

與 DOTA2 在去年的 TI 表演賽的失利相比,OpenAI Five 在 4 月 14 日戰(zhàn)勝 OG 團(tuán)隊(duì)的主要原因是其訓(xùn)練的計(jì)算量增加了 8 倍。去年比賽后,OpenAI 團(tuán)隊(duì)將項(xiàng)目中的絕大部分計(jì)算用于訓(xùn)練 OpenAI Five 模型,同時(shí)還增加了訓(xùn)練時(shí)間。

OpenAI Five 的 TrueSkill,由于已經(jīng)使用了額外的訓(xùn)練計(jì)算,所以用線來劃分主要的系統(tǒng)變化。這張圖的走向大致是線性的,意味著 OpenAI Five 不斷從額外計(jì)算中獲益。

總之 ,OpenAI Five 的當(dāng)前版本已經(jīng)訓(xùn)練了 800 petaflop/s /天,并且在10個(gè)實(shí)時(shí)月的時(shí)間內(nèi)進(jìn)行相當(dāng)于人類大約 45000 年時(shí)長的 DOTA 游戲自我訓(xùn)練,相當(dāng)于人類每天平均有 250 年的模擬訓(xùn)練。OpenAI Five 的最終版本與 TI 版本相比,勝率是 99.9%。

18 個(gè)英雄

從訓(xùn)練 5 名英雄到 18 名英雄時(shí)的訓(xùn)練進(jìn)度幾乎沒有放緩,他們已經(jīng)假設(shè)同樣的情況如果發(fā)生在更多的英雄身上會(huì)怎樣。TI比賽后,又花了很多精力去整合新的英雄。

他們花了幾周時(shí)間去訓(xùn)練多達(dá) 25 個(gè)英雄的英雄池,將這些英雄帶到大約 5k MMR(大約是95% DOTA 玩家的水平)。雖然在進(jìn)步,但學(xué)習(xí)速度不夠快,無法在決賽前達(dá)到職業(yè)水平。研究人員還沒有時(shí)間去找到原因,但后來發(fā)現(xiàn)模型容量不足,需要更好的匹配來擴(kuò)展英雄池,還需要更多的訓(xùn)練時(shí)間來讓新英雄趕上老英雄。但想象一下,當(dāng)一個(gè)人掌握了自己的英雄時(shí),再去學(xué)習(xí)一個(gè)新英雄是多么困難。

對(duì)了,這里明明說訓(xùn)練了 18 個(gè)英雄,但為什么在與 OG 比賽時(shí)只放了 17 個(gè)英雄?因?yàn)檫€有一個(gè)英雄在 DOTA v7.20 版本中出現(xiàn)了明顯變化,所以就沒用。

最后,這么好的機(jī)會(huì),要不要去體驗(yàn)下被機(jī)器人在 DOTA 中碾壓的酸爽感?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    212

    文章

    29421

    瀏覽量

    211338
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    256

    瀏覽量

    10938
  • 強(qiáng)化學(xué)習(xí)

    關(guān)注

    4

    文章

    269

    瀏覽量

    11510

原文標(biāo)題:“你行你上”:有本事跟OpenAI Five打一把DOTA?| 極客頭條

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    失去工作不是因?yàn)锳I,而是因?yàn)槭褂肁I的人

    當(dāng)算法能精準(zhǔn)預(yù)測(cè)消費(fèi)者需求時(shí),當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時(shí),當(dāng)自動(dòng)化系統(tǒng)開始取代基礎(chǔ)決策崗位時(shí),真正的危機(jī)已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?103次閱讀
    <b class='flag-5'>你</b>失去工作<b class='flag-5'>不是</b>因?yàn)锳I,而是因?yàn)槭褂肁I的人

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個(gè)命令

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個(gè)命令 在芯片設(shè)計(jì)工作中,EDA工具的安裝往往是新手或運(yùn)維人員最容易卡住的一步。不少人曾因一個(gè) RPM 包的依賴安裝失敗,陷入漫長
    發(fā)表于 05-09 15:27

    比亞迪海鷗榮膺2025世界汽車大獎(jiǎng)“世界城市車”冠軍

    近日,全球汽車行業(yè)權(quán)威獎(jiǎng)項(xiàng)“2025世界汽車大獎(jiǎng)”(World Car Awards)于紐約國際車展正式揭曉。比亞迪海鷗憑借其創(chuàng)新的設(shè)計(jì)理念、卓越的城市通勤性能及全球市場(chǎng)的高度認(rèn)可,從全球12款候選車型中脫穎而出,榮膺“2025世界城市車(World Urban Car)
    的頭像 發(fā)表于 04-18 17:52 ?428次閱讀

    嵌入式來了還在等什么?(可下載)

    笑話。每個(gè)人都在要求進(jìn)步,每個(gè)人都被逼著進(jìn)步,話說沒什么不好。但對(duì)使用的各種智能產(chǎn)品又知道多少呢?我們來聊聊身邊的必備品:有多少都是嵌入式或者單片機(jī)做出來的
    發(fā)表于 03-20 15:06 ?0次下載

    PCB電路板連接器插不進(jìn)去,客戶說用力

    PCB電路板的連接器插不去,找客戶確認(rèn),客戶說不夠用力……
    的頭像 發(fā)表于 03-03 14:40 ?280次閱讀
    PCB電路板<b class='flag-5'>上</b>連接器插不進(jìn)去,客戶說<b class='flag-5'>你</b>用力

    2024世界智能制造大會(huì)火熱進(jìn)行中!尋跡智4D04,誠邀蒞臨~

    2024世界智能制造博覽會(huì)在南京國際博覽中心盛大開幕,尋跡智展示了緊湊型托盤堆垛車BR-F12SL,協(xié)作式機(jī)械臂AMR-BR-D001A在智能搬運(yùn)領(lǐng)域的強(qiáng)大實(shí)力和創(chuàng)新能力,誠邀各位參觀交流。
    的頭像 發(fā)表于 12-22 20:01 ?403次閱讀
    2024<b class='flag-5'>世界</b>智能制造大會(huì)火熱進(jìn)行中!尋跡智<b class='flag-5'>行</b>4D04,誠邀蒞臨~

    冠軍說|第二屆OpenHarmony競(jìng)賽訓(xùn)練營冠軍團(tuán)隊(duì)專訪

    實(shí)現(xiàn)技術(shù)創(chuàng)新,解決現(xiàn)實(shí)問題的呢? 高校創(chuàng)新技術(shù)人才又將如何助力OpenHarmony技術(shù)生態(tài)的繁榮與活力? 點(diǎn)擊下方視頻一起聽冠軍說 探秘冠軍團(tuán)隊(duì)與老師的獨(dú)家幕后分享 OpenHarmony 競(jìng)賽
    發(fā)表于 10-28 17:11

    明明我說的是25G信號(hào),卻讓我看12.5G的損耗?

    還是從理論來說,我們這里提到的25G和12.5G其實(shí)不是一個(gè)概念。25G是說這對(duì)差分信號(hào)的傳輸速率,單位是bps,也就是我們常說的比特率。而協(xié)議12.5G指的是頻率,單位是Hz。那么重點(diǎn)來了,25G
    發(fā)表于 10-23 09:11

    可穿戴芯片細(xì)分市場(chǎng)機(jī)會(huì)來了,大算力產(chǎn)品、出海布局加速

    市場(chǎng)。終端市場(chǎng)的增長給上游藍(lán)牙芯片廠商帶來了成長機(jī)會(huì)。電子發(fā)燒友網(wǎng)整理了恒玄科技、杰理科技、中科藍(lán)訊、泰凌微、炬芯科技這五家企業(yè)的業(yè)績情況,由此分析上述企業(yè)在今年上半年的技術(shù)布局以及市場(chǎng)開拓情況。 ? ? AI+ 可穿戴
    的頭像 發(fā)表于 09-19 09:27 ?3960次閱讀
    可穿戴芯片細(xì)分市場(chǎng)<b class='flag-5'>機(jī)會(huì)來了</b>,大算力產(chǎn)品、出海布局加速

    必知!如何有效保護(hù)的IP地址

    地址是一種通過加密和隧道技術(shù)在公共網(wǎng)絡(luò)建立專用網(wǎng)絡(luò)的方法。當(dāng)你連接到服務(wù)器時(shí),的真實(shí)IP地址會(huì)被隱藏,取而代之的是服務(wù)器分配給你的IP地址。 二、避免隨意點(diǎn)擊不明鏈接 網(wǎng)絡(luò)存在大量的惡意鏈接,這些鏈接可能會(huì)引導(dǎo)
    的頭像 發(fā)表于 09-07 11:16 ?774次閱讀

    認(rèn)識(shí)貼片電阻嗎,對(duì)他了解多少?

    認(rèn)識(shí)貼片電阻嗎,對(duì)他了解多少?
    的頭像 發(fā)表于 08-27 15:49 ?991次閱讀
    <b class='flag-5'>你</b>認(rèn)識(shí)貼片電阻嗎,<b class='flag-5'>你</b>對(duì)他了解多少?

    信維通信榮獲“制造業(yè)單項(xiàng)冠軍企業(yè)”稱號(hào)

    近日,工業(yè)和信息化部發(fā)布了第八批制造業(yè)單項(xiàng)冠軍企業(yè)名單,信維通信憑借移動(dòng)終端天線領(lǐng)域多年深耕積累的產(chǎn)品實(shí)力、行業(yè)地位、市場(chǎng)份額等多方面優(yōu)勢(shì),成功獲評(píng)“制造業(yè)單項(xiàng)冠軍企業(yè)”稱號(hào)。
    的頭像 發(fā)表于 08-23 09:50 ?838次閱讀

    喜訊!瑞隆源榮獲廣東省制造業(yè)單項(xiàng)冠軍企業(yè)

    獲得制造業(yè)單項(xiàng)冠軍不僅是對(duì)瑞隆源在通信電源過壓過流防護(hù)器件領(lǐng)域技術(shù)實(shí)力和市場(chǎng)地位的認(rèn)可
    的頭像 發(fā)表于 08-05 10:19 ?444次閱讀
    喜訊!瑞隆源榮獲廣東省制造業(yè)單項(xiàng)<b class='flag-5'>冠軍</b>企業(yè)

    谷景告訴屏蔽繞線功率電感是不是感量越大性能越好

    谷景告訴屏蔽繞線功率電感是不是感量越大性能越好 編輯:谷景電子 屏蔽繞線功率電感是一種普遍的電路電感元件,它對(duì)于電路運(yùn)行的穩(wěn)定性特別重要。而電感量作為屏蔽繞線功率電感的一個(gè)性能指標(biāo),也是我們?cè)谧?/div>
    的頭像 發(fā)表于 06-10 18:48 ?768次閱讀

    豪威集團(tuán)發(fā)布900萬像素CMOS全局快門傳感器OG09A10

    豪威集團(tuán)近日發(fā)布了其最新力作——OG09A10,這是一款專為機(jī)器視覺應(yīng)用量身打造的CMOS全局快門(GS)傳感器。這款傳感器采用1英寸光學(xué)格式,擁有高達(dá)900萬像素的分辨率,為機(jī)器視覺應(yīng)用帶來了全新的視覺體驗(yàn)。
    的頭像 發(fā)表于 05-29 14:35 ?1252次閱讀