女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

視覺對話能力讓AI邁上新臺階

OaXG_jingzhengl ? 來源:YXQ ? 2019-07-02 16:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正如《2001太空漫游》《流浪地球》等科幻大片中無障礙的人機對話系統所描繪的那樣,擁有智能視覺對話能力的AI隨著技術的不斷突破,正在向我們走來。

每個人都有這樣的回憶,小時候語文老師教我們看圖說話,許多小朋友腦洞大開,說出來的答案讓人啼笑皆非。實際上,看圖說話的能力在年幼時期需要訓練,而對于大一點孩子來說就不成問題了。如今,機器人也能做到看圖說話了。

近日,來自中國AI在這項能力上已經打破了世界紀錄。在第二屆全球AI視覺對話競賽(Visual Dialogue Challenge)中,阿里AI擊敗了微軟、首爾大學等十支參賽隊伍,一舉獲得冠軍。

阿里AI在視覺對話競賽中得冠

會“看圖說話”的AI有多聰明?

這場視覺對話競賽由美國佐治亞理工大學、Facebook人工智能實驗室(FAIR)等機構聯合全球視覺技術領域頂級學術會議CVPR發起,是目前視覺對話領域最權威的競賽之一。

該競賽要求參賽的AI在看完近萬張圖片后,回答出人類對于任一圖片任一內容的提問。這要求AI不僅能夠描述出圖片中內容的概況,還要經得起人類對圖片各種細節的追問。比如,在一張撐著雨傘的人物圖片中,說出傘是什么顏色的,有多少人在圖中,附近有什么物品和建筑物等等信息。

視覺對話中AI可以從容應對人類提問(左為AI、右為人類)

競賽結果顯示,阿里AI以74.57%的準確率獲得冠軍,將上一屆比賽的紀錄提高了16.82%,并且超過微軟AI的64.78%的準確率。而在相同的數據集中,人類的準確率僅為64.27%,AI甚至勝過了人類。

傳統的視覺AI主要針對目標的檢測和識別,但對復雜場景中目標之間的邏輯關系理解、推理能力較弱,無法回答表達圖片對象直接關系的復雜問題,也難以將圖片信息轉化為人類理解的語言輸出。

這意味著,要實現視覺對話能力,傳統的視覺AI在學會“看圖”之后,還要有一種語言模型來支撐它“說話”。阿里AI的突破就在于提出了“遞歸探索對話模型”。

視覺對話AI與用戶交流圖像內容

這一模型通過標注信息學習出模仿人類認知復雜場景的思維方式,能識別圖片里的實體以及它們之間的關系,推理出圖片所描述的事件內容,并通過對上下文進行有效建模,綜合集成了圖像識別、關系推理與自然語言理解三大能力,能理解人類提出的問題及真實意圖,給出自然準確的回復。

視覺對話能力讓AI邁上新臺階

AI能“看圖說話”,這樣的應用其實距離我們并不遙遠,微軟之前推出了一款年齡測試工具How-old.net ,曾經刷爆微博和朋友圈,所應用的就是這一技術的應用。

目前微軟還開放了能“看圖說話”的AI系統,用戶進入官網上傳圖片,稍等一會,就能看到系統對于圖片的描述。其準確率雖然不低但依舊有待提升,以一張曾經廣為流傳的黑人問號表情圖片為例,AI很快給出了客觀的回答:“我覺得這是籃球隊員尼克·楊露出牙齒微笑?!?/p>

AI視覺對話識別圖片信息

以“看圖說話”為代表的視覺對話是近年來快速崛起的AI研究方向,目的在于教會機器用自然語言與人類討論視覺內容,這能夠使機器擁有了對真實視覺世界的理解與推斷能力,也意味著AI的認知能力將邁上新的臺階。

可以預見,這項技術未來將被應用在人機交互諸多場景:

在火災、地震后在廢墟中尋找幸存者的救援機器人,能夠代替人類之眼,深入危險的現場,及時、高效地綜合指揮指令和場景信息作出行動。

視覺對話技術有望人類提高地震救援效率

視障人士可以通過提問AI,理解圖像中的內容,了解自身所處的周圍環境,為其生活起居帶來更多的便利。

無人駕駛車輛也可以在行駛中通過視覺對話,更加準確理解人類意圖征詢人類的意見,讓乘客的乘坐體驗更好。

正如《2001太空漫游》《流浪地球》等科幻大片中無障礙的人機對話系統所描繪的那樣,擁有智能視覺對話能力的AI隨著技術的不斷突破,正在向我們走來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器視覺
    +關注

    關注

    163

    文章

    4596

    瀏覽量

    122888
  • AI
    AI
    +關注

    關注

    88

    文章

    35136

    瀏覽量

    279740

原文標題:機器人看圖說話能力比肩人類!中國AI超越微軟,打破世界紀錄

文章出處:【微信號:jingzhenglizixun,微信公眾號:機器人博覽】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在一些網絡條件受限或對數據隱私有較高要求的場景中,發揮著不可或缺的作用。本章基于CSK6大模型語音視覺
    發表于 07-04 11:14

    神眸引領AI智能視覺新范式,科技更有溫度

    AI能力矩陣,更是通過情感化交互與場景化服務,用戶真正感受到科技帶來的溫暖陪伴。神眸以“云、網、邊、端、芯”全鏈路自研架構為基石,從芯片級性能突破到云端智能服
    的頭像 發表于 05-23 13:24 ?401次閱讀
    神眸引領<b class='flag-5'>AI</b>智能<b class='flag-5'>視覺</b>新范式,<b class='flag-5'>讓</b>科技更有溫度

    首創開源架構,天璣AI開發套件端側AI模型接入得心應手

    模型、通義千問、混元等多種先進端側大模型,還包含視覺、語言、多模態等多種多樣的大模型,開發者可以通過Gen-AI Model Hub一鍵調用模型能力
    發表于 04-13 19:52

    燧原科技正式納入飛槳例行版本發布體系

    燧原科技與飛槳經過長時間的適配合作和持續集成(CI)建設,對飛槳合?的每?行代碼都在燧原硬件上進?了驗證。如今,燧原正式納入飛槳例行版本發布體系。未來,燧原將基于這?合作模式,共同?持飛槳重大版本發布,推動AI技術創新和開源?態發展
    的頭像 發表于 04-11 11:31 ?472次閱讀
    燧原科技正式納入飛槳例行版本發布體系

    單次、多次對話與RTC對話AI交互模式,如何各顯神通?

    在這個充滿無限可能的AI時代,這些奇妙場景正逐步走進我們的生活。你可曾想象過,有一天家里的智能設備會化身相聲演員,和你幽默對答?或者,你的玩具能像知心好友一樣,陪你暢聊心事?單次對話、多次對話
    的頭像 發表于 04-02 18:18 ?600次閱讀
    單次、多次<b class='flag-5'>對話</b>與RTC<b class='flag-5'>對話</b><b class='flag-5'>AI</b>交互模式,如何各顯神通?

    圣邦微電子SGM58201 24位高精度Σ-Δ ADC 最高22Bits ENOB有效分辨率

    如果您正在尋找一款具備高精度、低溫漂和高集成度的 ADC,SGM58201 是一個理想的選擇。它不僅能提升測量系統的精度和穩定性,也為高端測量應用提供了可靠方案,助力為工業、醫療、能源等領域的高端測量系統在技術不斷
    的頭像 發表于 03-11 11:41 ?1539次閱讀
    圣邦微電子SGM58201  24位高精度Σ-Δ ADC 最高22Bits ENOB有效分辨率

    AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

    學習、自然語言處理(NLP)、計算機視覺(CV)等先進技術提供的強大的數據處理和分析能力。 在視頻應用開發中,AI Agent可以用于視頻內容分析、推薦、編輯等。 下面跟隨作者的指導,使用語聚
    發表于 03-05 19:52

    DEKRA德凱與聯合電子合作新臺階

    近日,DEKRA德凱為聯合汽車電子有限公司(以下簡稱:UAES聯合電子)提供的ISO8800-人工智能與功能安全培訓課程圓滿結束,并在結業儀式為通過考核的學員代表們頒發了DEKRA德凱簽發的中國首批ISO8800-人工智能與功能安全培訓證書。
    的頭像 發表于 02-28 15:32 ?500次閱讀

    天津檢驗中心智創團隊:致力于構建全球領先的智能網聯汽車測試能力

    在剛剛過去的2024年,天津檢驗中心新“智”突破創效團隊堅持黨建引領,全面貫徹集團新質創效年工作任務,圓滿完成各項工作任務,實現部門戰斗力、創新力和凝聚力的整體提升,經濟效益新臺階,科技創新實現
    的頭像 發表于 02-12 11:43 ?1081次閱讀

    鼎捷雅典娜接入DeepSeek大模型,加速 AI 應用創新布局

    鼎捷數智(股票代碼:300378)近日宣布,DeepSeek大模型已全面集成至鼎捷IndepthAI智能體平臺及鼎捷全線智能應用,標志著鼎捷以“智能+”戰略為引領,AI布局再上新臺階。通過接入
    的頭像 發表于 02-10 15:18 ?737次閱讀
    鼎捷雅典娜接入DeepSeek大模型,加速 <b class='flag-5'>AI</b> 應用創新布局

    HarmonyOS NEXT 應用開發練習:AI智能對話

    顯示發送的時間戳,以便用戶了解消息的發送時間。 這個DEMO展示了如何使用ArkTS和擴展后的ChatUI框架(或類似功能的庫)在HarmonyOS NEXT創建一個功能豐富的AI智能對話框。我們可以根據需要進一步定制和擴展這
    發表于 01-03 11:29

    AI對話魔法 Prompt Engineering 探索指南

    Engineering 就是設計和優化與AI對話的“提示詞”或“指令”,AI能準確理解并提供有用的回應。 Prompt Engineering 主要包括以下幾個方面: 1.明確目標
    的頭像 發表于 11-07 10:11 ?1442次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>對話</b>魔法 Prompt Engineering 探索指南

    中科曙光推動液冷技術產業加速落地

    當前,我國算力基礎設施建設如火如荼,算力規模不斷新臺階。算力設施的高功耗,對冷卻設備和技術提出了更高要求。傳統液冷數據中心面臨著三個痛點難題:缺乏尖端實驗和研發環境、產品化能力不足
    的頭像 發表于 09-20 15:48 ?1056次閱讀

    對話藍牙技術聯盟首席執行官Neville Meijers

    藍牙技術聯盟(Bluetooth SIG)于近日宣布Neville Meijers擔任新任首席執行官。Neville Meijers將為藍牙技術聯盟帶來長期積累的變革領導力和堅持不懈的創新精神,他曾以此幫助電信和無線企業新臺階
    的頭像 發表于 09-04 09:27 ?675次閱讀

    AWS與Workday深化合作,推進生成式AI功能開發

    在云計算與人工智能融合發展的新篇章中,亞馬遜旗下的Amazon Web Services(AWS)與領先的企業管理軟件提供商Workday宣布深化合作,共同探索并開發前沿的生成式人工智能(AI)功能。此次強強聯合,標志著雙方在推動企業客戶數字化轉型、提升運營效率及優化人才管理等方面的合作
    的頭像 發表于 07-19 16:11 ?912次閱讀