女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦的“世界模型”簡述與啟發

mK5P_AItists ? 來源:lq ? 2019-01-30 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:我們的視覺看到什么,部分取決于大腦預測未來會看到什么。

我們的視覺看到什么,部分取決于大腦預測未來會看到什么,例如下圖中,如果你預計要看到突出的球體,那也許你就會看到,如果讓機器也具有了這樣的能力,會帶來什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復雜的環境中通過自我學習產生相應的策略,例如玩賽車游戲。

下面是世界模型的整體架構:

整個模型分為3個組件:視覺組件(V),記憶組件(M),控制組件(C)。視覺組件V用來壓縮圖片信息到一個隱變量z上(其實只是一個VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個rollout),輸出是預測下一幀圖像的可能分布,其實就是比一般LSTM更高級一些的MDN-RNN:

最后控制組件C的目標,就是把前面視覺組件V和記憶組件M的輸出一起作為輸入,并輸出這個時刻智能體agent應該做出的動作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒有是谷歌大腦自己創新研制的。但世界模型會很大提高強化學習訓練穩定性和成績 從而使其與其他強化學習相比有一些明顯優勢,如下表所示;

世界模型有如下的3個特點

1. 模型拼接得足夠巧妙,這個巧妙的拼接模型做到所謂的世界想象能力,就是模型在學習時,自身對環境假想一個模擬的環境,甚至可以在沒有環境訓練的情況下,自己想象一個環境去訓練。其實就是我們人類鏡像神經元的功能。

2. 抓住了一些“強視覺”游戲的“痛點”。記憶組件M中的RNN是生成序列的能手,所以根據之前游戲圖像再“想象”一些圖像幀應該不成問題(RNN生成一些隱變量z,再根據隱變量z,由視覺組件VAE的decode生成的圖像幀即可)。所以對于“強視覺”的游戲,把RNN的記憶能力用在視覺預測和控制上是個好主意 。

3不同于我們常見的“不可生”智能算法,例如遺傳算法和進化策略只是強調了基因的“變異”與在解空間中進行搜索,神經網絡只是固定網絡結構;而生物界的基因卻可以指導蛋白質構成并且“生長”。如果基因可以構造自身個體,外部環境和個體情況也可以反過來影響基因,而我們的模型都太固定呆板了,模型結構不能隨內部隱變量改進,當然最佳的設計形式也許誰也不知道。而世界模型做到了讓在內部”幻想“的環境中產生的策略轉移到外部世界中。

最后簡單看一下世界模型的訓練過程:

world models代碼基于chainer計算框架,步驟如下:

1. 準備數據集,隨機玩游戲生成訓練幀(rollouts意思應該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓練視覺組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓練控制組件C,即前面提到的CMA-ES算法(其實就是支持更復雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測試訓練結果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108119
  • 機器
    +關注

    關注

    0

    文章

    790

    瀏覽量

    41281
  • 智能體
    +關注

    關注

    1

    文章

    304

    瀏覽量

    11078

原文標題:谷歌大腦的“世界模型”簡述與啟發

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛中常提的世界模型是個啥?

    [首發于智駕最前沿微信公眾號]隨著自動駕駛技術的不斷成熟,車輛需要在復雜多變的道路環境中安全地行駛,這就要求系統不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發表于 06-24 08:53 ?161次閱讀
    自動駕駛中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個啥?

    世界模型:多模態融合+因果推理,解鎖AI認知邊界

    電子發燒友網綜合報道 在人工智能的蓬勃發展進程中,世界模型正嶄露頭角,成為推動其邁向更高智能水平的關鍵力量。世界模型作為 AI 系統對外部世界
    的頭像 發表于 06-23 04:49 ?2399次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實驗
    的頭像 發表于 02-07 15:07 ?714次閱讀

    英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數據問題

    CES 2025展會上,英偉達推出了基石世界模型Cosmos,World Foundation Model基石世界模型,簡稱WFM。 物理 AI
    的頭像 發表于 01-14 11:04 ?1274次閱讀
    英偉達推出基石<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Cosmos,解決智駕與機器人具身智能訓練數據問題

    華為、理想、特斯拉、商湯的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人說世界模型是終極自動駕駛解決方案,實際上它只是端到端大模型的一種,和VLM沒有本質區別。
    的頭像 發表于 01-14 09:27 ?1002次閱讀
    華為、理想、特斯拉、商湯的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    英偉達發布Cosmos世界基礎模型

    近日,在2025年1月6日于拉斯維加斯拉開帷幕的國際消費類電子產品展覽會(CES)上,英偉達宣布了一項重大創新——Cosmos世界基礎模型平臺。該平臺集成了先進的生成世界基礎模型,旨在
    的頭像 發表于 01-09 10:23 ?709次閱讀

    NVIDIA Cosmos世界基礎模型平臺發布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成式世界基礎模型、高級 tokenizer、護欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機器人等物理 AI 系統的發展。
    的頭像 發表于 01-08 10:39 ?562次閱讀

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3 模型根據這些提示生成高質
    的頭像 發表于 01-03 10:38 ?894次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen<b class='flag-5'>模型</b>生成高質量圖像

    【「大模型啟示錄」閱讀體驗】對本書的初印象

    對大模型的利用還停留在非常表層的階段,遠未達到其真正的潛力。我對大模型的深層作用和深遠影響的理解還相當有限。我渴望能夠更深入地了解大模型,探索它們如何塑造我們的世界,以及如何更好地將這
    發表于 12-16 14:05

    谷歌發布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發表于 12-12 10:13 ?642次閱讀

    OpenAI世界最貴大模型:昂貴背后的技術突破

    2023年“雙十二”的第一天,OpenAI推出了其最強推理模型o1的滿血版及其Pro版本。同時,ChatGPT也推出了每月200美元的Pro訂閱計劃,這一價格使其一躍成為“世界最貴的大模型”。下面,AI部落小編帶您深入了解Ope
    的頭像 發表于 12-06 14:46 ?1065次閱讀

    Waymo利用谷歌Gemini大模型,研發端到端自動駕駛系統

    邁新步,為其機器人出租車業務引入了一種基于谷歌多模態大語言模型(MLLM)“Gemini”的全新訓練模型——“端到端多模態自動駕駛模型”(EMMA)。
    的頭像 發表于 10-31 16:55 ?1719次閱讀

    谷歌計劃12月發布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發布其下一代人工智能模型——Gemini 2.0。這一消息引發了業界的廣泛關注,因為谷歌在人工智能領域一直保持著領先地位,而Gemini系列模型更是其重要
    的頭像 發表于 10-29 11:02 ?1137次閱讀

    什么是大模型?快速了解大模型基本概念

    “在人工智能的世界里,大模型就像超級大腦一樣,能夠處理和理解大量的信息。你可能聽說過ChatGPT,它就是大模型的一個典型代表。那么,什么是大模型
    的頭像 發表于 08-07 08:28 ?2759次閱讀
    什么是大<b class='flag-5'>模型</b>?快速了解大<b class='flag-5'>模型</b>基本概念

    谷歌獲Character.AI大模型技術授權,創始人重歸谷歌懷抱

    8月5日最新資訊,創新企業Character.AI在上周五正式宣布,他們已經與科技巨頭谷歌的母公司Alphabet達成了一項重要合作,非獨家授權谷歌使用其先進的大型語言模型技術。此次合作不僅標志著雙方在人工智能領域的深度合作,也
    的頭像 發表于 08-05 14:35 ?757次閱讀