女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI賭神贏的背后,只是8天的訓練

mK5P_AItists ? 來源:YXQ ? 2019-08-15 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017年年初,Brain vs AI的德州撲克人機大戰在卡耐基梅隆大學(CMU)落幕,由4名人類職業玩家組成的人類大腦不敵人工智能程序Libratus。

獲勝后人類還遭到了Libratus的無情嘲諷。

但是那時候Libratus還只是個只能在1V1局里稱霸的超級玩家,要說人類最喜歡的6人局這樣的“大場面”,當時的Libratus還沒有拿到入場券。

而就在昨天,Facebook與CMU學Noam Brown、Tuomas Sandholm的最新研究成果——Pluribus,就在人類最常見的無限制德州撲克6人局里,戰勝了人類頂尖選手。

跟還是不跟?高手之間的對決

Darren Elias(1986年11月18日出生)是一名美國職業撲克玩家,曾獲得四項世界撲克巡回賽冠軍。

在他與Pluribus的對決過程中,Darren Elias從來沒有遇到過如此不害怕的對手。

一個有經驗的撲克玩家,當有兩個J(一個面朝上,另一個藏起來,一手既不好也不壞)時,都會謹慎行事。但是Elias的對手看起來好像不知道該怎么做。即使當Elias決定虛張聲勢(bluff),下注時看起來很有信心,而他的對手似乎在鼓勵他繼續!好像一點都沒有被嚇到。

最后,Elias的虛張聲勢沒有起作用,他輸了。

Elias

正如埃利亞斯先生意識到的,Pluribus知道什么時候該虛張聲勢,也知道別人在虛張聲勢,還知道什么時候該改變自己的行為,這樣其他玩家就無法確定自己的策略。32歲 Elias先生說: 它確實做了一些人類很難做到的事情。

贏的背后,只是8天的訓練

之前AI和人玩游戲,要么是雙人游戲,如國際象棋、跳棋等,要么就是雙方之間的零和博弈(一方贏一方輸),AI可以在游戲中找到Nash equilibrium strategy(納什平衡)來保證自己不會輸。

關于Nash equilibrium strategy(納什平衡)屬于博弈論范疇(注:納什證明了,如果允許混合策略,那么任何一個博弈,只要參與者數量是有限的、參與者可以選擇的純策略也是有限的,那么這個博弈至少有一個納什均衡)。

以經典的“石頭剪刀布”游戲為例,AI可以在游戲中找到對方的弱點和常出的手勢進行學習,以達到最終的勝利,而多人撲克意味著玩家數量的增多,在更復雜的游戲中,AI難以確定如何與納什均衡相抗衡;采用固定策略不能很快觀察到的對手的策略傾向,而且需要監控到多個玩家在游戲中策略的轉變,這對于AI多人撲克博弈來說,是一項挑戰。

鑒于多人游戲,如果學習多個玩家的出牌習慣等特征的訓練數據集成本過大,這里Pluribus采用的策略是自己與自己博弈,不使用人類對手的數據作為模型訓練的輸入。在開始時,隨機的選擇玩法,通過不斷的訓練來提升自己的性能,這里采用的博弈策略是改良版本的迭代的蒙特卡洛CFR(MCCFR),通過自我博弈,左右手互博,自己制定了一個blueprint strategy(藍圖策略),最后對每個可能的狀況進行概率分布統計,通過搜索決策樹來決定下一步的行為,是叫牌還是出牌。

CFR是一種迭代的自我游戲算法,AI從完全隨機游戲開始,然后通過學習擊敗早期版本的自己逐漸改進。

在算法的每次迭代中,MCCFR指定一個玩家作為其當前策略在迭代中更新的標記。在迭代開始時,MCCFR根據當前所有玩家的策略(最初是完全隨機的)模擬一手撲克牌。一旦模擬完成,人工智能就會回顧每一個玩家做出的決定,然后通過選擇其他可用的行動來預測這個決定的好壞程度。

Pluribus玩家博弈樹

在解決不完全信息博弈中搜索的問題,Pluribus跟蹤每一手,根據其策略達到目前狀況的可能性。不管Pluribus實際上握著的牌,它首先會計算如何使用可能的每一手,謹慎地平衡所有的策略,以保持對于對手的不可預測性。

Pluribus 中的實時搜索

撲克以外的事

之前在1V1局中大勝人類的Libratus后來去五角大樓上班去了,國防部認為這種策略型人工智能或許可以幫助他們進行戰略的制定。

負責 Pluribus 項目的 研究員Noam Brown說:“Pluribus的技術可以用于華爾街交易、拍賣、政治談判和網絡安全這些活動中,這些活動就像撲克一樣,涉及隱藏信息,因為你并不總是知道真實世界的狀態。”

盡管像谷歌這樣的公司,有著“Don't be evil”的信條,但是,不可避免的是這樣能夠理解人類策略的人工智能,還是會引發大眾對于人工智能的某種恐懼,或者說,如果這樣的人工智能被運用到軍事決策中,將會帶來多嚴重的后果?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35093

    瀏覽量

    279476
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134573

原文標題:AI賭神升級!無懼bluff,6人局德撲完勝世界冠軍,訓練只用了8天

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    海思SD3403邊緣計算AI數據訓練概述

    AI數據訓練:基于用戶特定應用場景,用戶采集照片或視頻,通過AI數據訓練工程師**(用戶公司****員工)** ,進行特征標定后,將標定好的訓練
    發表于 04-28 11:11

    Deepseek海思SD3403邊緣計算AI產品系統

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產品工具包,解決客戶低成本AI系統,針對差異化AI 應用場景,自己采集樣本數據,進
    發表于 04-28 11:05

    首創開源架構,AI開發套件讓端側AI模型接入得心應手

    ,聯發科帶來了全面升級的AI開發套件2.0,在模型庫規模、架構開放程度、前沿端側AI技術支持和端側LoRA訓練落地等方面均迎來全面躍遷,為開發者提供了更全面、更開放、更強大的端側
    發表于 04-13 19:52

    摩爾線程GPU原生FP8計算助力AI訓練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓練策略和高性能算子庫,這兩大框架在國產全功能GPU上實現了高效的混合
    的頭像 發表于 03-17 17:05 ?600次閱讀
    摩爾線程GPU原生FP<b class='flag-5'>8</b>計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>

    訓練好的ai模型導入cubemx不成功怎么處理?

    訓練好的ai模型導入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發表于 03-11 07:18

    AI Cube進行yolov8n模型訓練,創建項目目標檢測時顯示數據集目錄下存在除標注和圖片外的其他目錄如何處理?

    AI Cube進行yolov8n模型訓練 創建項目目標檢測時顯示數據集目錄下存在除標注和圖片外的其他目錄怎么解決
    發表于 02-08 06:21

    璣 9400拿下AI性能榜冠軍,最強NPU引領手機AI應用變革

    近兩年, AI手機端側AI應用和AI體驗開始進入“超級加速”的時期,層出不窮的技術創新背后其實更離不開手機芯片的核心支持。在這股浪潮中,聯發科
    的頭像 發表于 12-30 20:09 ?705次閱讀
    <b class='flag-5'>天</b>璣 9400拿下<b class='flag-5'>AI</b>性能榜冠軍,最強NPU引領手機<b class='flag-5'>AI</b>應用變革

    GPU是如何訓練AI大模型的

    AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練
    的頭像 發表于 12-19 17:54 ?740次閱讀

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具。
    的頭像 發表于 10-24 09:39 ?957次閱讀

    AI大模型的訓練數據來源分析

    AI大模型的訓練數據來源廣泛且多元化,這些數據源對于構建和優化AI模型至關重要。以下是對AI大模型訓練數據來源的分析: 一、公開數據集 公開
    的頭像 發表于 10-23 15:32 ?3632次閱讀

    如何訓練自己的AI大模型

    訓練自己的AI大模型是一個復雜且耗時的過程,涉及多個關鍵步驟。以下是一個詳細的訓練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務和應用領域需要不同類型的AI模型
    的頭像 發表于 10-23 15:07 ?4947次閱讀

    璣9400首發端側AI訓練,在手機上就把AI變聰明

    隨著AI技術的快速發展,聯發科通過天璣9400芯片進一步鞏固了其在手機端側AI市場的領導地位。作為璣系列最新的旗艦產品,璣9400不僅具備強大的
    的頭像 發表于 10-14 18:25 ?705次閱讀
    <b class='flag-5'>天</b>璣9400首發端側<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>,在手機上就把<b class='flag-5'>AI</b>變聰明

    首發端側LoRA訓練璣9400保護隱私更懂你

    聯發科發布的璣9400無疑是智能手機芯片領域的一次重大革新。這款全大核SoC首次將生成式AI引入手機端,特別是在AI視頻生成和AI訓練方面
    的頭像 發表于 10-14 17:32 ?870次閱讀
    首發端側LoRA<b class='flag-5'>訓練</b>!<b class='flag-5'>天</b>璣9400保護隱私更懂你

    蘋果承認使用谷歌芯片來訓練AI

    蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端AI
    的頭像 發表于 07-30 17:03 ?912次閱讀

    AI訓練的基本步驟

    AI(人工智能)訓練是一個復雜且系統的過程,它涵蓋了從數據收集到模型部署的多個關鍵步驟。以下是對AI訓練過程的詳細闡述,包括每個步驟的具體內容,并附有相關代碼示例(以Python和sc
    的頭像 發表于 07-17 16:57 ?5249次閱讀