女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能體如何應(yīng)對訓(xùn)練中故意碰瓷兒的“弱”對手呢?

倩倩 ? 來源:大數(shù)據(jù)文摘 ? 2020-01-02 15:50 ? 次閱讀

人們通常會(huì)派出最強(qiáng)大的選手和場景訓(xùn)練人工智能,但是,智能體如何應(yīng)對訓(xùn)練中故意碰瓷兒的“弱”對手呢?

來看看下邊的兩個(gè)場景:兩個(gè)AI智能體正在“訓(xùn)練場“進(jìn)行一場激烈的足球賽,一個(gè)守門、一個(gè)射門。當(dāng)守門員忽然自己摔倒,攻方?jīng)]有選擇乘勝追擊,也忽然不知所措了起來。

在相撲的規(guī)則下也一樣,當(dāng)其中一個(gè)隊(duì)員開始不按套路出牌時(shí),另一個(gè)對手也亂作一團(tuán),雙方立刻開始毫無規(guī)則扭打在一起。

這樣“人工智障”的場景可不是隨意配置的游戲,而是一項(xiàng)對AI對抗訓(xùn)練的研究。

我們知道,通常情況下,智能體都是通過相互對抗來訓(xùn)練的,無論是下圍棋的阿法狗還是玩星際爭霸的AlphaStar,都是通過海量的對局來訓(xùn)練自己的模型,從而探索出獲勝之道。

但是試想一下,如果給阿法狗的訓(xùn)練數(shù)據(jù)都是圍棋小白亂下的對局,給AlphaStar提供的是小學(xué)生局,結(jié)果會(huì)是如何?

近期,來自伯克利的研究人員就進(jìn)行了這樣的實(shí)驗(yàn)。紅色機(jī)器人與已經(jīng)是專家級別的藍(lán)色機(jī)器人進(jìn)行對抗訓(xùn)練,紅色機(jī)器人采取一定的對抗策略攻擊藍(lán)色機(jī)器人進(jìn)行的深度學(xué)習(xí)。這項(xiàng)研究的論文作者也在NIPS大會(huì)上對該研究進(jìn)行了展示。

論文鏈接:

https://arxiv.org/pdf/1905.10615.pdf

在實(shí)驗(yàn)中,紅色機(jī)器人為了不讓藍(lán)色機(jī)器人繼續(xù)從對抗中學(xué)習(xí),沒有按照應(yīng)有的方式玩游戲,而是開始“亂舞”起來,結(jié)果,藍(lán)色機(jī)器人開始玩得很糟糕,像喝醉了的海盜一樣來回?fù)u晃,輸?shù)舻挠螒驍?shù)量是正常情況下的兩倍。

研究發(fā)現(xiàn),在采取對抗性政策的對局中,獲勝不是努力成為一般意義上的強(qiáng)者,而是采取迷惑對手的行動(dòng)。研究人員通過對對手行為的定性觀察來驗(yàn)證這一點(diǎn),并發(fā)現(xiàn)當(dāng)被欺騙的AI在對對手視而不見時(shí),其表現(xiàn)會(huì)有所改善。

我們都知道,讓人工智能變得更聰明的一個(gè)方法是讓它從環(huán)境中學(xué)習(xí),例如,未來的自動(dòng)駕駛可能比人類更善于識別街道標(biāo)志和避開行人,因?yàn)樗鼈兛梢酝ㄟ^海量的視頻獲得更多的經(jīng)驗(yàn)。

但是如果有人利用這一方式進(jìn)行研究中所示的“對抗性攻擊” ——通過巧妙而精確地修改圖像,那么你就可以愚弄人工智能,讓它對圖像產(chǎn)生錯(cuò)誤的理解。例如,在一個(gè)停車標(biāo)志上貼上幾個(gè)貼紙可能被視為限速標(biāo)志,同時(shí)這項(xiàng)新的研究也表明,人工智能不僅會(huì)被愚弄,看到不該看到的東西,還會(huì)以不該看到的方式行事。

這給基于深度學(xué)習(xí)的人工智能應(yīng)用敲響了一個(gè)警鐘,這種對抗性的攻擊可能會(huì)給自動(dòng)駕駛、金融交易或產(chǎn)品推薦系統(tǒng)帶來現(xiàn)實(shí)問題。

論文指出,在這些安全關(guān)鍵型的系統(tǒng)中,像這樣的攻擊最受關(guān)注,標(biāo)準(zhǔn)做法是驗(yàn)證模型,然后凍結(jié)它,以確保部署的模型不會(huì)因再訓(xùn)練而產(chǎn)生任何新問題。

因此,這項(xiàng)研究中的攻擊行為也真實(shí)地反映了在現(xiàn)實(shí)環(huán)境中,例如在自動(dòng)駕駛車輛中看到的深度學(xué)習(xí)訓(xùn)練策略,此外,即使被攻擊目標(biāo)使用持續(xù)學(xué)習(xí),也會(huì)有針對固定攻擊目標(biāo)進(jìn)行訓(xùn)練的策略,攻擊者可以對目標(biāo)使用模擬學(xué)習(xí)來生成攻擊模型。

或者,在自動(dòng)駕駛車輛,攻擊者可以通過購買系統(tǒng)的副本并定期在工廠重置它,一旦針對目標(biāo)訓(xùn)練出了敵對策略,攻擊者就可以將此策略傳輸?shù)侥繕?biāo),并利用它直到攻擊成功為止。

研究也對今后的工作提出了一些方向:深度學(xué)習(xí)策略容易受到攻擊,這突出了有效防御的必要性,因此在系統(tǒng)激活時(shí)可以使用密度模型檢測到可能的對抗性攻擊,在這種情況下,還可以及時(shí)退回到保守策略。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29463

    瀏覽量

    211431
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    262

    瀏覽量

    10945
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5554

    瀏覽量

    122449
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    【HarmonyOS NEXT】華為分享-開發(fā)分享

    注冊監(jiān)聽事件,當(dāng)目標(biāo)設(shè)備與宿主設(shè)備進(jìn)行操作后,宿主應(yīng)用發(fā)現(xiàn)設(shè)備,調(diào)用分享事件回
    發(fā)表于 05-16 16:19

    (GUOCI)F系列貼片電容

    F系列防嘯叫、低ESR貼片電容 國F系列產(chǎn)品采用特殊陶瓷材料設(shè)計(jì),其由精確的介電材料和適當(dāng)?shù)膶?dǎo)電漿料配制,自動(dòng)化制程的穩(wěn)定生產(chǎn)和嚴(yán)謹(jǐn)?shù)馁|(zhì)量精確管控了介電設(shè)計(jì)厚度、電極完整性以及端電極連接的良好特性,實(shí)現(xiàn)了最佳可靠度、失效開路的產(chǎn)品性能。
    發(fā)表于 05-09 15:14

    硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能化用戶體驗(yàn)時(shí)代到來

    、適配與部署;Dimensity Profiler提供深層調(diào)試能力;而天璣AI開發(fā)套件2.0則在模型規(guī)模、訓(xùn)練性能與平臺接口全面升級,為開發(fā)者打造從芯片到底層算法的閉環(huán)支持。 駛向AI下一站——智能
    發(fā)表于 04-13 19:51

    學(xué)習(xí)智能開發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí),這本書太及時(shí)了,非常想看看。
    發(fā)表于 03-27 15:48

    PRISEMI芯導(dǎo)科技推出新品–全面應(yīng)對手機(jī)EOS問題

    PRISEMI芯導(dǎo)科技推出新品–全面應(yīng)對手機(jī)EOS問題
    的頭像 發(fā)表于 02-05 15:53 ?383次閱讀
    PRISEMI芯導(dǎo)科技推出新品–全面<b class='flag-5'>應(yīng)對手</b>機(jī)EOS問題

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    和經(jīng)驗(yàn)積累,使機(jī)器人能夠自主發(fā)現(xiàn)工藝規(guī)律,優(yōu)化作業(yè)參數(shù)。家庭服務(wù)機(jī)器人則采用混合任務(wù)規(guī)劃策略:將預(yù)訓(xùn)練的基礎(chǔ)技能與實(shí)時(shí)規(guī)劃相結(jié)合,靈活應(yīng)對開放環(huán)境的各種情況。 第9章深入探討了元學(xué)習(xí)在具身
    發(fā)表于 12-24 15:03

    介電容器失效模式分析方法

    介電容器作為電子元件的重要組成部分,其失效模式分析對于保障電子設(shè)備的可靠性和穩(wěn)定性具有重要意義。 一、引言 介電容器,即陶瓷介質(zhì)電容器,因其高頻特性好、溫度系數(shù)小、耐高壓等優(yōu)點(diǎn),在電子電路
    的頭像 發(fā)表于 09-20 15:35 ?1122次閱讀

    介電容器在性能上有哪些主要優(yōu)缺點(diǎn)

    介電容器是一種使用陶瓷材料作為介質(zhì)的電容器,廣泛應(yīng)用于電子電路,用于儲存和釋放電能、濾波、去耦、諧振等。由于陶瓷材料的介電常數(shù)較高,介電容器通常具有較小的體積和較高的電容值。然而,它們也有一些
    的頭像 發(fā)表于 09-20 15:25 ?1356次閱讀

    華嶺申正式竣工投產(chǎn)!

    華嶺股份全資子公司—上海華嶺申集成電路有限責(zé)任公司(以下簡稱:華嶺申)在上海臨港舉行開業(yè)儀式。上海自由貿(mào)易試驗(yàn)區(qū)臨港新片區(qū)管委會(huì)高科處副處長吳海濤、臨港集團(tuán)副總經(jīng)濟(jì)師、臨港科投公司董事長翁巍、臨
    的頭像 發(fā)表于 08-20 16:54 ?1112次閱讀

    電磁干擾訓(xùn)練系統(tǒng)原理是什么

    智慧華盛恒輝電磁干擾訓(xùn)練系統(tǒng)的原理主要基于電磁干擾(EMI)的基本原理,即利用電磁波對電子設(shè)備或系統(tǒng)產(chǎn)生的干擾,通過模擬真實(shí)的電磁環(huán)境,對受訓(xùn)人員進(jìn)行電磁干擾應(yīng)對能力的訓(xùn)練。以下是電磁干擾訓(xùn)練
    的頭像 發(fā)表于 07-22 16:34 ?664次閱讀

    海上電磁干擾訓(xùn)練系統(tǒng)

    智慧華盛恒輝海上電磁干擾訓(xùn)練系統(tǒng)是一種專門用于模擬海上電磁環(huán)境、訓(xùn)練人員應(yīng)對電磁干擾能力的系統(tǒng)。以下是對海上電磁干擾訓(xùn)練系統(tǒng)的詳細(xì)解析: 智慧華盛恒輝系統(tǒng)概述 智慧華盛恒輝海上電磁干擾
    的頭像 發(fā)表于 07-15 16:05 ?465次閱讀

    工業(yè)一機(jī)在智能分揀的應(yīng)用

    工業(yè)一機(jī)在智能分揀系統(tǒng)的應(yīng)用是物流行業(yè)自動(dòng)化和智能化升級的重要組成部分。這些設(shè)備通常具備高性能計(jì)算能力、穩(wěn)定性和耐用性,能夠在復(fù)雜和苛刻的工業(yè)環(huán)境
    的頭像 發(fā)表于 07-15 15:25 ?561次閱讀
    工業(yè)一<b class='flag-5'>體</b>機(jī)在<b class='flag-5'>智能</b>分揀<b class='flag-5'>中</b>的應(yīng)用

    其利天下技術(shù)·無刷電機(jī)磁控制是什么?有什么好處·BLDC驅(qū)動(dòng)方案

    作為一個(gè)無刷電機(jī)驅(qū)動(dòng)方案開發(fā)商,我們在開發(fā)產(chǎn)品的時(shí)候就會(huì)用到“磁控制技術(shù)”。比如,我們開發(fā)的吸塵器方案時(shí)就會(huì)用到。什么是磁控制技術(shù),它又有什么優(yōu)勢?其利天下技術(shù)無刷電機(jī)驅(qū)動(dòng)方案開發(fā)
    的頭像 發(fā)表于 06-07 18:42 ?1773次閱讀
    其利天下技術(shù)·無刷電機(jī)<b class='flag-5'>弱</b>磁控制是什么?有什么好處·BLDC驅(qū)動(dòng)方案

    什么是電機(jī)的磁?電機(jī)磁的可能原因有哪些?

    在電機(jī)運(yùn)行的過程,我們有時(shí)會(huì)遇到電機(jī)磁的情況。電機(jī)磁,簡而言之,即電機(jī)在運(yùn)行時(shí)輸出功率下降,不足以滿足正常使用需求的現(xiàn)象。這一現(xiàn)象可能由多種原因引起,對電機(jī)的性能和運(yùn)行穩(wěn)定性產(chǎn)生不良影響。本文將詳細(xì)探討電機(jī)的
    的頭像 發(fā)表于 06-04 16:15 ?6419次閱讀

    遇到液晶拼接屏幕左右黑屏的問題應(yīng)該怎樣應(yīng)對

    如今放眼望與商顯市場,液晶拼接屏現(xiàn)在已廣泛的被應(yīng)用于各個(gè)行業(yè)領(lǐng)域。在液晶拼接屏被廣泛應(yīng)用的同時(shí),用戶對液晶拼接屏的“五臟”并不了解,不管液晶拼接屏的性能有多么的穩(wěn)定,但是日常中小故障也是難免會(huì)有的,比如,液晶拼接屏左右黑屏的現(xiàn)象就是問題常見之一。如果遇到此種問題,用戶應(yīng)該怎樣應(yīng)
    的頭像 發(fā)表于 06-04 14:37 ?899次閱讀
    遇到液晶拼接屏幕左右黑屏的問題應(yīng)該怎樣<b class='flag-5'>應(yīng)對</b><b class='flag-5'>呢</b>?