女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind給AI測IQ,結果出人意料!

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-07-24 16:52 ? 次閱讀

活在一個AI“泛濫”的時代,我們幾乎每天都能看到 AI 研究上的最新進展。昨天,AI 打 DoTA 戰勝人類了;今天,AI 能自己找路了;明天,AI 能假冒人類打電話了。在擔心 AI 會滅掉人類的人們眼中,AI 正像一只怪物一樣野蠻生長,像一只侵略軍一樣從遠方大跨步逼近。

然而實際上,你所看到的這些進展,只是不同的 AI 在特定方向的進步。雖然當前基于深度學習的 AI 熱潮已經有五六年了,還是沒有一個獨立的 AI,像一個獨立的人一樣,能夠優秀地執行多種任務。

人們在形容 AI 時,通常會用這樣一種說法:這個 AI 的智商,跟三歲小孩差不多。 智商 (Intelligence quotient) 簡稱 IQ,是評價人類智商一個普遍接受的標準 。你有智商,我也有智商,就連三歲小孩也有智商。接下來問題來了:既然說 AI 跟三歲小孩差不多,那么它的智商到底有多少呢

得給 AI 測測智商了。

DeepMind要給AI測IQ

自 AlphaGo 橫空出世以來,AI 在解決一些復雜的、策略性的問題上,能力已經得到了證明。但如果想要更像“人”,AI 必須也擁有像人類一樣的抽象理解能力。

現在的 AI 計算能力不用說了,推理能力也很強,所以只剩抽象理解能力了。Google 旗下的 AI 科研機構 DeepMind 認為,“基于神經網絡機器學習模型取得了驚人的成績,但想要衡量其推理抽象概念的能力,卻非常困難?!?/p>

為了搞清楚現在的 AI 在抽象理解能力上究竟實力如何,DeepMind 還真給 AI 設計了一套測試題:

這套測試題,借鑒了人類的 IQ 測試里著名的瑞文推理測驗:給定一組圖片,找到符合其“演進”規律的圖片。

(圖片來源:DeepMind 論文)

在這種測試中,題目里并不會告訴你要找到符合什么標準的圖形,而是需要我們根據日常生活中學習或掌握到的一些基本原則,來理解和分析測試中出現的簡單圖案。

要找到正確的答案,往往要借鑒我們從生活中明白的“演進”規律。比如小樹苗長成大樹,比如從 0 到1、2、3、4、5 的加法,再比如加減乘除。以上這些,就是我們生活中所提煉出的抽象的“演進”(progression)的意義,就是人類的抽象理解能力。

“但是,我們現在還沒有找到辦法,能讓 AI 也可以從 ‘日常經驗’中學到類似的能力?!?DeepMind 在論文中說。

“不過,我們依然可以很好地利用人類的這種視覺抽象邏輯測試,來設計一個實驗。在這個測試中,我們并不是像人類測試那樣,考察從日常生活到視覺推理問題的知識轉移。而是研究AI在將知識從一組受控的視覺推理問題,轉移到另一組問題的能力?!?/p>

簡單翻譯一下這段話就是:DeepMind 先給 AI 喂一組由三角形構成的圖像的視覺推理題庫,等訓練的差不多了,再出一組由方塊構成的視覺推理題,讓 AI 去回答,看它是能隨機應變舉一反三,還是學會了三角,換成方塊就不靈了。

機器人仍需努力

對于擔心 AI 取代人類的朋友來說,DeepMind 的一部分實驗結果確實是個好消息:一些最棒的 AI 模型,在這個IQ測試中的表現得并不咋樣。

正如預期的那樣,當訓練集和測試集所采用的抽象元素相同時,多個 AI 模型都表現出超過75%的準確率。

然而,當測試集和訓練集出現變化,甚至有時候只是把黑點換成較暗的淺色圓點,AI 的表現就會像無頭蒼蠅一樣,失去了準星。

(一些知名AI模型的表現 圖片來源:DeepMind 論文)

上面這些都是深度神經網絡領域的當紅炸子雞,測起智商來卻沒那么靈光了。

ResNet (Deep Residual Network),即深度殘差網絡在其中一組測試中僅僅得到22.4%的低分。 要知道,它的提出曾被形容為CNN(卷積神經網絡)的一個里程碑式事件,它在網絡深度上比其他模型提升了n個量級,更重要的是它的殘差學習方式,改良了模型的架構,因此一出現就秒殺眾前輩。

測試中表現最好的 WReN 模型,則是 DeepMind 在關系網絡 (Relation Networks) 模型基礎上改良的版本。它增加了對不同圖像組合之間關系的分析,并可以對這類 IQ 測試的各種可能性結果進行評估。

不過,DeepMind 針對這個測試的邏輯,對一些模型進行改良,改良后的模型表現出明顯的提升。

比如,在一些模型中,DeepMind 加入了元標記(meta-targets) 的輔助訓練方法,讓模型對數據集背后體現出的形狀、屬性(形狀的數量、大小、顏色深淺等)以及關系(同時出現、遞減、遞增等等)進行預測,當這部分預測準確時,最終回答的準確率就明顯出現提升,預測錯誤時,回答準確率明顯下降。一些極端情況下,模型回答的準確率更是從預測錯誤時的32%提升至了87%。

(元標記預測準確度與最終答案準確率的關系圖)

DeepMind 表示,他們設計的這個實驗,最終目的并不是為了讓 AI 能夠通過這種 IQ 測試。他們關注的是 AI 泛化能力的問題。

泛化是指模型很好地擬合以前未見過的新數據的能力,這是機器學習界的術語,你也可以粗暴的理解成一個 AI 模型能否在各類場景中“通吃”。AI 的泛化能力越強,離啥都能干的所謂“通用人工智能”就越近。

DeepMind 在博客最后這樣說道:

研究表明,尋找關于泛化問題的普遍結論可能沒有任何意義。我們測試的神經網絡在某些泛化方案中表現優秀,但是其他方案下卻很糟糕。

諸如所使用模型的架構、模型是否被訓練從而能解釋答案背后的邏輯等一系列因素,都會對泛化效果帶來影響。而在大多數情況下,當需要處理過往經驗從未涉及的、或完全陌生的情景時,這些 AI 的表現很糟糕。

至少現在看來,AI 還有很長的路要走啊。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34223

    瀏覽量

    275390
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11375

原文標題:DeepMind給最厲害的AI測了IQ,結果讓人輕松了不少!

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    特斯拉“出人意料”三季度報!馬斯克:明年推平價車型,預期銷售增三成

    今年,全球電動汽車銷量第一的位置,在比亞迪和特斯拉的較量中越發激烈,盡管比亞迪在 2023 年第四季度首次在電動汽車銷量上超過特斯拉,但特斯拉在 2024 年第一季度重新奪回了冠軍。特斯拉在第二季度繼續超越比亞迪,成為全球最大的電動汽車制造商,交付量達443,956 輛。特斯拉在第三季度的市場表現如何?最新的財報來了。 ? 美東時間10月23日,美國特斯拉公司迎來了今年的高光時刻,特斯拉披露三季度營收和凈利潤,盡管收入略低于預期,但是
    的頭像 發表于 10-25 00:15 ?5230次閱讀
    特斯拉“<b class='flag-5'>出人意料</b>”三季度報!馬斯克:明年推平價車型,預期銷售增三成

    AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

    用戶的視頻生成請求和展示生成的視頻結果。 將前端界面與語聚AI平臺中的AI助手進行集成,確保前端能夠正確地調用AI助手的功能并接收返回的視頻結果
    發表于 03-05 19:52

    人工智能重塑投資策略:七大出人意料的途徑

    人工智能(AI)已經成為投資管理領域的一股變革力量?,F代投資者現在可以使用復雜的人工智能工具,這些工具可以分析大量的金融和替代數據,識別模式,并幫助做出更明智的投資決策。 根據最近的一項行業調查
    的頭像 發表于 02-19 11:48 ?782次閱讀
    人工智能重塑投資策略:七大<b class='flag-5'>出人意料</b>的途徑

    諾基亞迎來新任CEO

    諾基亞近期宣布了一項出人意料的人事變動,任命Justin Hotard為新任首席執行官。Hotard此前在英特爾擔任人工智能業務負責人,他的到來將接替即將離職的Pekka Lundmark。Lundmark在諾基亞任職超過四年,將于3月31日正式卸任,而Hotard則將在次日接任這一重要職位。
    的頭像 發表于 02-11 16:50 ?591次閱讀

    DeepMind創始人預計年內有AI設計藥物進入臨床試驗

    近日,英國人工智能公司DeepMind的創始人兼首席執行官德米斯·哈薩比斯(Demis Hassabis)透露,預計在今年年底前,將有人工智能(AI)設計的藥物進入臨床試驗階段。
    的頭像 發表于 01-24 15:46 ?2102次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌已將AI Studio團隊整體轉移至DeepMi
    的頭像 發表于 01-13 14:40 ?610次閱讀

    如何在STM32f4系列開發板上部署STM32Cube.AI,

    已下載STM32Cube.AI擴展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經過開發板處理器進行AI模型處理識別過后,告訴我識別結果,顯示在TFL
    發表于 11-18 09:39

    OpenAI推遲GPT-5發布,專注草莓計劃GPT-o1及AI代理愿景

    形成了有力競爭。然而,近日OpenAI的首席執行官Sam Altman卻透露了一個出人意料的消息:盡管公司計劃在年底前推出多項重要更新,但備受期待的GPT-5并不會在今年面世。
    的頭像 發表于 11-05 16:57 ?789次閱讀

    投影雙雄極米與當貝意外攜手,共謀行業新篇章

    在中國智能投影產業峰會上,國產投影儀市場的兩大領軍品牌——極米和當貝,出人意料地簽署了戰略合作協議。這一舉動不僅打破了行業內的競爭壁壘,更為整個投影行業釋放出了新的信號。   作為投影行業
    的頭像 發表于 11-01 12:36 ?746次閱讀

    CC13xx IQ樣本

    電子發燒友網站提供《CC13xx IQ樣本.pdf》資料免費下載
    發表于 09-20 11:12 ?0次下載
    CC13xx <b class='flag-5'>IQ</b>樣本

    谷歌Vertex AI助力企業生成式AI應用

    DeepMind 在模型技術方面積極探索創新,尤其著力于 Gemini 和 Imagen 的改進。我們的企業 AI 平臺 Vertex AI 也推出了數十項突破性功能。
    的頭像 發表于 09-09 15:59 ?815次閱讀

    AI普及嵌入式設計人員帶來新挑戰

    探討了人工智能(AI)的普及嵌入式設計人員帶來的新挑戰。在創建“邊緣機器學習(ML)”應用時,設計人員必須確保其能有效運行,同時最大限度地降低處理器和存儲開銷,以及物聯網(IoT)設備的功耗
    發表于 08-22 14:20 ?844次閱讀
    <b class='flag-5'>AI</b>普及<b class='flag-5'>給</b>嵌入式設計人員帶來新挑戰

    平衡創新與倫理:AI時代的隱私保護和算法公平

    ,如果醫生和患者都能了解AI推薦治療方案的原因,將大大增加對技術的接受度和信任。 算法公平性的保障同樣不可或缺。AI系統在設計時就需要考慮到多樣性和包容性,避免因為訓練數據的偏差而導致結果的不公平
    發表于 07-16 15:07

    基本電子元件的內在之美

    ),其內部竟出人意料地令人嘆服。晶體管、發光二極管(LED)和其他半導體可能是最重要的部分,但電阻器、電容器和電感器的簡單物理特性也有其獨特之處?!猄amuel K. Moore
    發表于 07-11 16:49

    數字調制系列:IQ調制器特性

    常見的數字調制方式,并解釋為什么經過IQ調制器后帶寬會翻倍的原因。
    發表于 06-18 09:26 ?0次下載