女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

決策神經科學:解決機器人技術中的關鍵挑戰

DPVg_AI_era ? 來源:lq ? 2019-02-25 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通過模仿人類大腦在日常生活中做出決策時使用的策略,可以顯著增強機器人智能。最近,科學家們找到了最新觀點。

本周五在國內上映的《阿麗塔:戰斗天使》又掀起了一波智能熱,這部由著導演詹姆斯·卡梅隆(James Cameron)擔任編劇和制片的電影,講述了擁有人類大腦、機械身軀的女主角,不斷改變世界、認識自我的故事。

這部背景發生在26世紀的電影,依舊把人類大腦作為承載智慧、情感和決策的關鍵能力。

而現在,一份來自韓國高等科學技術研究院(KAIST)、劍橋大學、日本國家信息通信技術研究所(NICT)和谷歌DeepMind的聯合研究認為,通過模仿人類大腦在日常生活中做出決策時使用的策略,可以顯著增強機器人智能,他們的方法是:將神經科學應用于機器人大腦。

最近,這項研究發表在了Science Robotics雜志上。

決策神經科學:解決機器人技術中的關鍵挑戰

人類和自主機器人不斷需要學習和適應新的環境。兩者的不同之處在于,人類能夠根據獨特情況做出決策,而機器人仍然依靠預定數據來做出決策,這是目前機器人的短板。

強化學習(RL)成為通過與世界交互來理解決策的主要理論框架,并且最近在構建具有超人類表現的智能體方面取得成功。然而,哪怕是最新的強化算法仍然存在很大的局限性,例如,缺乏制定目標導向策略的能力,或依賴大量經驗來學習。

這些限制阻礙了機器人在任務或背景頻繁變化的動態環境中快速適應的能力。

相比之下,人類在經驗有限的條件下迅速適應環境變化方面具有非凡的能力。決策神經科學(decision neuroscience)的最新發現表明,大腦不僅為RL使用多個控制系統,而且還使用一種靈活的元控制機制(metacontrol mechanism)來選擇控制選項,每個不同選項分別與預測性能、認知負荷和學習速度相關。

理解大腦如何實現這些選項可能會讓RL算法解決機器人的實際控制問題。

在Science Robotics上發表的研究中,研究人員討論了人類RL相關的最新發現,這些發現可能會解決機器人技術中的幾個關鍵挑戰:性能—效率—速度權衡、多機器人設置中的沖突需求以及探索—開發困境。

詳細解讀:元控制可以類似大腦

首先,決策神經科學的證據表明,人類利用兩種不同的行為控制策略:

刺激驅動的習慣性(stimulus--driven habitual);

目標導向的認知控制(goal--directed cognitive control)。

習慣性控制是自動且快速的,盡管它在不穩定的環境中很脆弱,并且能由model--free RL很好地解釋,model--free RL通過無環境模型下的試錯過程來逐步學習行為的價值。

相反,目標導向的控制可以迅速適應環境的變化,但它具有認知需求。它通過學習環境模型來指導行動,并利用這個知識庫快速適應環境結構的變化,例如學習狀態-行動空間中的潛在(隱藏)原因。

model--based RL和model--free RL之間的這種計算上的區別表明它們之間存在不可避免的妥協。model--free RL學習起來比較慢,但一旦策略被學習并實現自動化,就可以快速地實現目標。model--based RL通常比model--free RL提供更多的準確預測,但計算量要大得多。每種策略都提供了關于準確性、速度和認知負荷的互補解決方案,突出了預測性能和計算效率之間的權衡。

其次,RL算法通常需要大量經驗來充分學習不同環境因素下的因果關系(incremen-tal learning)。然而,人類的學習速度很快——通常一個從未經歷過的事件發生一次之后就已學習(“one--shot learn-ing”)。

神經科學最近的研究發現,當與環境的交互受到限制時,人類有很強的提高學習速度的傾向;他們會努力迅速弄清環境中未知的部分,即使這會危及安全。這些結果表明,大腦是直接執行計算來尋找性能和速度之間的權衡。

第三,越來越多的證據支持這樣一種觀點,即前額葉皮層使元控制能夠靈活地在不同的學習策略之間進行選擇,例如在model--based RL和model--free RL 之間,以及在incremental learning和one--shot learning之間。

在新的環境中,元控制通過選擇model--based RL來強調性能。因為這在計算上很昂貴,當大腦發現進一步學習沒有什么好處時,就會轉向model--free RL:要么環境非常穩定,可以做出精確的預測;要么高度不穩定,以至于基于模型的RL的預測不如無模型RL的預測可靠。

在其他情況下,元控制優先考慮速度。當預估的因果關系中的不確定性很高時,大腦傾向于轉換到one-shot學習,以快速解決預測結果中的不確定性。然而,當agent對所有可能的因果關系都同樣不確定時,它會重新轉向incremental learning以確保安全的學習。

這些機制表明類似于大腦的元控制可以處理性能-效率-速度的權衡。

第四,人類的RL可以解釋在人類進化中起重要作用的社會現象。在多主體相互作用的人類社會中,存在著具有部分競爭性和部分一致性激勵機制的社會困境。

使用model--based的RL方法成功地在更復雜的時間擴展設置中實現了協作。

人類似乎通過使用元認知(metacognition)來繞過這個問題——元認知是一種評估自己表現的能力,即評估自信和/或不確定性的水平。例如,較低的任務難度或較低的環境噪聲會使學習主體自信,從而導致更果斷的行動,而失去自信則會導致更謹慎和防御性的策略。元認知學習因此可以快速適應環境的變化,同時保持對環境噪聲的魯棒性。這樣的策略有可能增強機器人的決策能力。

總之,將人類決策神經科學的發現整合起來,可以為機器人的動作控制系統提供有價值的見解,從而實現更安全、更有能力、更高效的學習。

對大腦建模,算法能否支撐起意識?

另外,研究團隊還認為,這種跨學科的方法也應該引起神經科學的注意,為開發新的人類決策計算理論提供一個可靠的測試基礎。

最近對焦慮、抑郁和成癮等精神疾病背后的興趣引起了很多人的興趣,這使得一系列復雜的理論在沒有某種先進的情境平臺的情況下難以測試。這種情況需要一種對人類大腦進行建模的方法,以找出它在現實生活中如何與世界相互作用,以測試這些模型中的不同異常是否以及如何引起某些疾病。

例如,如果我們可以在機器人中重現焦慮行為或強迫癥,那么就可以預測需要做些什么來治療。研究團隊預計,開發不同精神疾病的機器人模型,與研究人員現在使用動物模型的方式類似,將成為臨床研究的關鍵未來技術。

最后再回到電影《阿麗塔》。

電影中所有的機器人都擁有人類的生命、有機大腦。機器人能從脊髓或大腦直接將信號傳遞到假體中的代碼,使截癱或四肢癱瘓的人能夠隨著機器人技術的進步再次獲得行動能力。

如果放到現在的時代,這種技術看上去非常棒;但電影設定發生在五百年后,AI依然只是作為支撐軀體的技術,核心還是人類的大腦而不是由算法主導意識與行動,看來卡梅隆和羅德里格斯導演的腦洞還是小了點:)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 控制系統
    +關注

    關注

    41

    文章

    6780

    瀏覽量

    112146
  • 機器人
    +關注

    關注

    213

    文章

    29726

    瀏覽量

    212799
  • 代碼
    +關注

    關注

    30

    文章

    4900

    瀏覽量

    70689

原文標題:Science子刊:為機器人復制腦代碼,無限接近人類決策

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    盤點#機器人開發平臺

    圖,電子技術資料網站具身智能機器人****開發平臺——Fibot廣和通發布機器人開發平臺-電子發燒友網NVIDIA Isaac 英偉達綜合性機器人開發平臺NVIDIA Isaac 是英
    發表于 05-13 15:02

    詳細介紹機場智能指路機器人的工作原理

    帶)定位、Wi - Fi 定位等。藍牙定位可以通過與機場內部署的藍牙信標進行通信,獲取機器人的大致位置信息。UWB 定位則利用超寬帶信號實現更精確的定位,能夠在復雜的室內環境達到較高的定位精度,誤差
    發表于 05-10 18:26

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器人視覺與地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地圖構建)的學習,我對機器人視覺感知和自主導航的核心技術有了更深入的理解。以下是我
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    的非常好的,特別是一些流程圖,很清晰的闡釋了概念 很適合作為初學者入門的引路書 還能了解很多技術和框架,破除初學者的自負困境,讓初學者知道功能是由很多開發者維護的,前人已經為各種產品搭建了完善的框架。避免陷入得一個單打獨斗的錯覺 一直蠢蠢欲動ros2和
    發表于 04-30 01:05

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    具身智能機器人的基礎模塊,這個是本書的第二部分內容,主要分為四個部分:機器人計算系統,自主機器人的感知系統,自主機器人的定位系統,自主機器人
    發表于 01-04 19:22

    《具身智能機器人系統》第10-13章閱讀心得之具身智能機器人計算挑戰

    閱讀《具身智能機器人系統》第10-13章,我對具身智能機器人的工程實踐有了全新認識。第10章從實時性角度剖析了機器人計算加速問題。機器人定位
    發表于 01-04 01:15

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    的局限性以及衡量大模型的關鍵指標。閱讀了該部分后,我感受到了一種前所未有的震撼,這種震撼不僅來源于技術本身的先進性,更來源于它對傳統機器人控制方式的顛覆。 傳統機器人的局限性與大模型的
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

    現狀和前沿研究,詳細介紹大模型的構建方法、訓練數據、模型架構和優化技術。 第4部分(第10章到第13章)深入探討提升機器人計算實時性、算法安全性、系統可靠性及具身智能數據挑戰的具身智能機器人
    發表于 12-28 21:12

    【「具身智能機器人系統」閱讀體驗】1.全書概覽與第一章學習

    景不確定性、產業鏈成本高企、系統集成難度大、數據瓶頸、倫理規范的挑戰。 其中系統集成難度大中,作者非常形象地將具身智能機器人分解為“大腦”、“小腦”和“軀干”三個關鍵技術,其中“大腦”就是機器
    發表于 12-27 14:50

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優化手術路徑規劃。工業場景,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智
    發表于 12-24 15:03

    【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能的價值

    的第二個挑戰是 “數據孤島”。獲取如此全面的數據充滿了挑戰,包括高成本、耗時要求和潛在的安全風險。大多數 EAI 機器人組織僅限于在特定的受控環境收集數據。實體之間缺乏數據共享加劇
    發表于 12-24 00:33

    【「具身智能機器人系統」閱讀體驗】+初品的體驗

    解決許多技術的和非技術挑戰,如提高智能體的自主性、處理復雜環境互動的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術機器
    發表于 12-20 19:17

    《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

    要給AI這個聰明的“頭腦”裝上一副“身體”。這個“身體”可以是一部手機,可以是一臺自動駕駛汽車。而人形機器人則是集各類核心尖端技術于一體的載體,是具身智能的代表產品。與傳統的軟件智能體不同,具身智能
    發表于 12-19 22:26

    虹科攜手Seed Robotics,開啟機器人靈巧手合作新篇章

    近日,虹科與SeedRobotics正式建立合作伙伴關系,雙方將在機器人靈巧手領域展開深入合作,共同推動人工智能、神經科學、心理學和認知科學等領域的創新研究與應用發展。此次合作,虹科
    的頭像 發表于 12-05 01:00 ?884次閱讀
    虹科攜手Seed Robotics,開啟<b class='flag-5'>機器人</b>靈巧手合作新篇章

    名單公布!【書籍評測活動NO.51】具身智能機器人系統 | 了解AI的下一個浪潮!

    智能體的自主性、處理復雜環境互動的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術機器人技術結合,探索更加先進的知識表示和記憶模塊,利用強化學習進一步優化決策
    發表于 11-11 10:20