女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IBM發布最新AI模型,幫視障者“看”到更多

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-25 08:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在IBM最新的論文中,研究人員提出了一種能自主制作多樣化、創造性和符合人類語境的圖片文字說明的模型。實驗證明,圖片的文字說明取得了“良好”的性能,未來可以為強大的新計算機視覺系統奠定了基礎。

無論是報社、雜志社還是新媒體,編輯們最不愿意干得事情就是為圖片搭配文字說明。事實上這項工作必要且重要但實際操作上又非常枯燥。

不過,一個振奮人心的消息是,AI可能很快就能處理大部分工作。6月18日在加州長灘舉行的2019年計算機視覺和模式識別會議(CVPR)上,Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu發表了一篇論文《改進圖像說明的對抗性語義對齊》,提出了一種能夠自主制作多樣化、創造性和符合人類語境的圖片文字說明的模型。

在論文中,他們將圖像說明作為一種有條件的GAN(生成式對抗網絡)訓練進行研究,提出了一種上下文感知的LSTM字幕器和共同注意鑒別器,它們加強了圖像和字幕之間的語義對齊。

研究人員根據經驗著重研究了SCST和ST兩種訓練方法的可行性。他們發現即使沒有直接訪問鑒別器梯度,SCST也比ST顯示出更穩定的梯度行為和更好的結果。進而還解決了對這些模型進行自動評估的開放性問題,引入了一個新的語義評分,并證明了它與人類判斷的強相關性。

作為評估范例,一個重要的標準是生成器能夠概括出平常不會一起出現的對象之間的組合關系。為此研究人員引入了一個小標題能脫離上下文(OOC)測試集。OOC與常規語義評分相結合,為圖片搭配說明文字得體系提出了新基準。當面向OOC和MS-COCO進行測試時,可以發現基于SCST的訓練在語義評分和人類評估方面都有很強的表現,有望成為高效離散GAN訓練的一種有價值的新方法。

目前,構建系統需要解決自動說明文字系統的一個主要缺點:順序語言生成導致語法正確—但同質、非自然和語義不相關的結構。

研究者的方法是通過一個注意力文字說明模型來解決這個問題,模型使用它正在觀察的照片中的場景片段來造句。在每一個生成步驟中,團隊的AI都可以選擇關注最后一步的視覺或文本提示。

為了確保生成的文字說明聽起來不太機械化,研究團隊在訓練時使用了生成對抗網絡(GANs)——由生成樣本的生成器和試圖區分生成樣本和現實世界樣本的鑒別器組成的兩部分神經網絡。共同注意鑒別器通過一個在像素級匹配場景和生成單詞的模型對新句子的“自然度”進行評分,使文字說明者能夠通過圖像和句子成對來進行合成。

文字說明系統中的另一個常見問題是,如何避免訓練數據集的偏差,即經常遭受過度擬合(特定數據集過于接近的分析)就需要構建診斷工具,否則并不適合推廣到學習對象(“床和臥室”)出現在看不見的環境(“床和森林”)中的場景。為此,研究人員提出了一種標題圖像的測試語料庫,其設計方式使得不良模型性能表明過度擬合。

在實驗中,Amazon's Mechanical Turk評估人員負責識別AI模型生成的文字說明,并判斷每句話對相應圖像的描述程度,給出幾個真實的和合成的樣本,研究人員表示,他們的文字說明總體上取得了“良好”的性能。他們相信他們的工作為強大的新計算機視覺系統奠定了基礎,并打算在未來的工作中繼續探索這些系統。另外,銜接語言和視覺語義的鴻溝表明需要將常識和推理融入場景理解中。

未來,圖像文字說明的自動生成和場景理解的進步,使AI系統可以作為視覺障礙者的助理改善他們的日常生活。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1823

    瀏覽量

    75853
  • AI
    AI
    +關注

    關注

    88

    文章

    35197

    瀏覽量

    280327

原文標題:IBM發布最新AI模型,幫視障者“看”到更多

文章出處:【微信號:Aiobservation,微信公眾號:人工智能觀察】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Nordic收購 Neuton.AI 關于產品技術的分析

    與 Nordic 的 nRF54 系列超低功耗無線 SoC 結合,使得即使是資源極為有限的設備也能高效運行邊緣 AI。Nordic 目前正在將 Neuton 深度集成自身開發生態中,未來會提供更多工具、固件
    發表于 06-28 14:18

    DevEco Studio AI輔助開發工具兩大升級功能 鴻蒙應用開發效率再提升

    隨著搭載HarmonyOS 5的Pura X發布,鴻蒙生態進入快車道,各應用正在加速適配開發,越來越多開發加入鴻蒙應用開發浪潮中。為提升鴻蒙應用開發效率,華為前不久上線了首款開發
    發表于 04-18 14:43

    海康威發布多模態大模型AI融合巡檢超腦

    基于海康觀瀾大模型技術體系,海康威推出新一代多模態大模型AI融合巡檢超腦,全面升級人、車、行為、事件等算法,為行業帶來全新的多模態大模型
    的頭像 發表于 04-17 17:12 ?839次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    生態和天璣AI生態的全面打通。這意味著,天璣開發將有機會獲取更多NVIDIA TAO生態的AI開發資源,TAO生態開發可將開發成果輕松移
    發表于 04-13 19:52

    海康威發布模型一體化平臺

    海康“觀瀾”大模型+DeepSeek“雙模”協同,海康威發布“大模型一體化平臺”,圍繞“匯聚、融合、開放”助力大模型能力,在千行百業快速便
    的頭像 發表于 03-20 17:34 ?898次閱讀

    Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    RZ/V2N——近期在嵌入式世界2025上新發布,為 AI 計算、嵌入式系統及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發和企業用戶對高性能、低功耗和靈活擴展的需求。 []() 領先的計算
    發表于 03-19 17:54

    RDK加持的導盲眼鏡:人士的“眼睛外掛”

    我國有超1700萬人士,如何讓他們更安全、自主地出行?別擔心,智能瞳行來啦!這是一款“自帶外掛”的導航神器,集成了高精度視覺傳感和YOLO算法,實時識別障礙物、行人、交通標志,并通過語音播報精準
    的頭像 發表于 03-14 19:43 ?654次閱讀
    RDK加持的導盲眼鏡:<b class='flag-5'>視</b><b class='flag-5'>障</b>人士的“眼睛外掛”

    IBM發布全新Granite 3.2 AI模型

    Granite 3.2 是小型的 AI 模型,通過對開發人員友好的授權條款,提供推理、視覺和護欄功能。
    的頭像 發表于 03-06 16:47 ?583次閱讀

    IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型

    ,進一步增強企業在安全、治理以及規模化部署方面的能力。 DeepSeek R1是IBMAI領域的一項重要創新,它采用了蒸餾模型技術,能夠在保持模型性能的同時,顯著減小
    的頭像 發表于 02-14 10:21 ?540次閱讀

    DeepSeek最新AI模型現已登陸IBM watsonx.ai平臺

    ,工程和科學計算提供裨益。 利用已部署的模型(如 IBM Granite,Llama,DeepSeek等)和以下解決方案能力,開發可以在 IBM watsonx.
    的頭像 發表于 02-08 09:21 ?773次閱讀

    IBM攜手歐萊雅開發首個可持續化妝品AI模型

    的關鍵洞察,幫助歐萊雅使用可持續的原材料,從而減少能源和材料浪費。雙方將開發定制的AI 基礎模型,以顯著提高歐萊雅研發與創新團隊的能力,助力公司在各類化妝品和全球范圍內進一步提升業績和消費滿意度。這一基于化妝品配方的基礎
    的頭像 發表于 01-21 09:22 ?700次閱讀

    IBM推出高性能AI模型Granite 3.0

    在近日舉行的IBM年度TechXchange大會上,IBM正式推出了其最先進的AI模型家族——Granite 3.0。這款旗艦級語言模型代表
    的頭像 發表于 10-28 17:39 ?833次閱讀

    IBM發布Granite 3.0 AI模型家族

    IBM在近日舉行的年度TechXchange大會上,正式推出了其迄今為止最先進的AI模型家族——Granite 3.0。這一系列的發布標志著IBM
    的頭像 發表于 10-23 17:09 ?774次閱讀

    IBM發布面向企業的人工智能模型新版本

    近日,IBM正式發布了其面向企業的人工智能模型——Granite 3.0的最新版本,旨在抓住當前企業紛紛擁抱生成式AI技術的熱潮。與IBM
    的頭像 發表于 10-22 17:32 ?808次閱讀

    IBM Granite系列模型被Forrester評為“強勁表現

    近日,IBM 憑借其旗艦 Granite 系列模型,在 2024年第二季度的《Forrester Wave:語言 AI 基礎模型》報告中,被評為“強勁表現
    的頭像 發表于 08-16 11:34 ?804次閱讀