女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DALL-E 2的錯誤揭示出人工智能的局限性

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 作者:Eliza Strickland ? 2022-11-16 15:31 ? 次閱讀

OpenAI的文字圖像轉換器與文本、科學和偏見作斗爭。

在2022年4月,人工智能(AI)研究實驗室OpenAI繼2021年推出的DALL-E后,又推出了DALL-E 2。這兩個人工智能系統都可以根據自然語言的文本描述來生成令人驚奇的圖像,包括照片、插圖、繪畫、動畫和其他能用語言表達藝術風格的幾乎任何圖片(見下圖)。DALL-E 2的分辨率更高,處理速度更快,增加的編輯功能能夠讓用戶僅使用文本命令修改已生成圖像,例如“把那個花瓶換成植物”或“讓狗的鼻子更大一點”。

對于DALL-E 2,全球最初的反應是震驚和欣慰。它可以在幾秒鐘之內把任何物體和生物組合在一起,可以模仿任何藝術風格,還能描繪任何地點,并且可以刻畫各種照明條件。比如說,看到宇航員騎著一匹馬的安迪?沃霍爾(Andy Warhol)風格圖片,誰能不被感動?不過,隨著人們列出可以被這種技術輕易擾亂的行業,也難免出現了一絲擔憂。

OpenAI尚未向公眾、商業實體乃至整個人工智能社區發布相關技術。OpenAI的研究員馬克?陳(Mark Chen):“我們和大家一樣擔心濫用的問題,而且非常重視這件事。”該公司確實邀請了一些人,針對DALL-E 2進行實驗。過去幾個月出現的研究結果充分說明了現今深度學習技術的局限性,也給我們打開了一個窗口,了解對于人類世界,人工智能有哪些能夠理解,又有哪些完全沒有理解。

工作原理

OpenAI在論文預印本網站ArXiv上發布的一篇論文表明,DALL-E 2接受了從互聯網上截取的約6.5億個圖像-文本對的訓練。通過這個龐大的數據集,它學習圖像與描述這些圖像的文字之間的關系。OpenAI在訓練之前對數據集進行篩選,移除了包含明顯暴力、色情和其他惡劣內容的圖片。“模型沒有暴露這些概念之下。”陳說,“所以它生成未見過內容的可能性非常非常低。”但研究人員明確指出,這種過濾有局限性,DALL-E 2仍然有可能生成有害的內容。

一旦這種“編碼器”模型經過訓練,可理解文本和圖片之間的關系,OpenAI就將它與一個可根據文本提示生成圖片的解碼器配對,使用一種名為“擴散”的方法,從隨機的點圖案開始,慢慢改變圖案,生成圖像。此外,該公司集成了一些過濾器,以便生成的圖像符合內容政策,并承諾了不斷進行更新。可能產生禁止內容的改變會被阻止,而且為了防止深度偽造,它無法準確地再現在訓練過程中見過的面孔(這可部分解釋為什么它通常會產生超現實的面孔)。到目前為止,OpenAI還采用了人工審查員檢查被標記為可能有問題的圖像。

由于DALL-E 2明顯有可能被濫用,OpenAI最初授權使用的只有幾百人,大多是人工智能研究人員和藝術家。與該實驗室的語言生成模型GPT-3不同,即便是有限的商業應用,DALL-E 2 也尚不具備,而且OpenAI也未公開討論相關計劃。不過,瀏覽DALL-E 2用戶創建并發布在Reddit等論壇上的圖像,可以發現有些專業應用確實應該引起擔憂,例如DALL-E 2擅長的美食攝影、公司手冊和網站的圖片庫,以及適用于宿舍海報或雜志封面上的插圖。

問題所在

熱心的實驗者生成的圖像表明,盡管DALL-E 2有很多優勢,但關于這個世界,它還需要學習很多東西。以下是3個最明顯、最引人關注的錯誤。

文本: DALL-E 2雖然擅長理解生成圖像的文本提示,卻很難將可理解的文本放入圖像,這一點令人感到費解。用戶發現,要求放入任意類型的文本都會產出一堆混亂的字母。珍妮爾?肖恩(Janelle Shane)喜歡在自己的人工智能博客里利用該系統創建公司的徽標,并觀察由此產生的混亂。不過,未來的版本可能會糾正該問題,因為OpenAI的GPT-3團隊有著豐富的文本生成專業知識。肖恩:“最終,DALL-E的后繼者將能夠拼寫‘松餅屋’(Waffle House),那一天我一定會很傷心的。我還得換一種不同方式來擾亂它、找樂子。”

科學:你可以說DALL-E 2理解一些科學定律,因為它可以輕松地描繪掉落的物體或漂浮在太空中的宇航員。但要求它生成解剖圖、X光圖、數學證明或藍圖時,它生成的圖像看似正確,而實際上卻是完全錯誤的。例如,要求DALL-E 2“按比例繪制太陽系圖解插圖”,在得到的結果圖像中,地球非常奇怪,而且有太多假設的太陽系鄰居。“DALL-E不懂什么是科學。它只知道怎樣閱讀文字說明,然后繪圖。”OpenAI的研究院阿迪蒂亞?拉梅什(Aditya Ramesh)說,“因此它不理解其中的含義,而試著編造一些看起來相似的東西。”

3a5af20c-64d7-11ed-8abf-dac502259ad0.jpg

偏見:DALL-E 2被認為是一種接受圖片和文本訓練的多模態人工智能系統,會表現出某種形式的多模態偏見。例如,如果用戶要求它生成一名首席執行官、一名建筑工人或者一名技術記者的圖片,它通常會根據其在訓練數據中看到的圖片-文本對來提供男性的圖片。在發布DALL-E 2之前,OpenAI要求從事該領域相關工作的外部研究員來充當“紅隊”,他們的見解有助于OpenAI評估該系統的風險和局限性。他們發現,除了表現有關性別的社會成見,該系統會過多地表現白人和西方傳統與環境。

陳認為“我們可以采取某些機器學習緩解措施”來糾正這些偏見,該團隊已經采取了一些措施,例如,在訓練期間他們發現,由于在訓練數據中消除了的色情內容,在建立的數據集中男性要多于女性,這導致DALL-E 2生成更多男性的圖像。“所以我們調整了訓練方法,并提高了女性圖像的權重,使其更有可能生成女性圖像。”陳解釋道。為了幫助DALL-E 2產生更多樣化的結果,用戶還可以使用“女性宇航員”或“印度婚禮”等指定性別、種族或地理位置的提示。

總之,DALL-E 2團隊表示,他們渴望看到早期用戶在測試系統時發現的問題和故障,他們也已經在考慮接下來的工作。“我們非常有興趣提高系統的整體智能。”拉梅什說,并補充說該團隊希望能在“DALL-E中加深對語言及其與世界關系的理解”。他指出OpenAI的文本生成工具GPT-3對普通常識、科學和人類行為有著非常驚人的理解。“一個充滿希望的目標是嘗試通過DALL-E將GPT-3的知識與圖像領域聯系起來。”拉梅什說。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48691

    瀏覽量

    246426
  • 深度學習
    +關注

    關注

    73

    文章

    5554

    瀏覽量

    122475
  • OpenAI
    +關注

    關注

    9

    文章

    1201

    瀏覽量

    8634

原文標題:DALL-E 2的錯誤揭示出人工智能的局限性

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    樹莓派 也能搞 AI 藝術?樹莓派遇上DALL-E,開啟你的 AI 藝術創作之旅!

    本教程將向你展示如何使用DALL-EAPI從你的RaspberryPi上生成隨機的AI藝術。近年來,人工智能(AI)是一個取得了巨大飛躍的領域,這在很大程度上要歸功于OpenAI等團隊的努力。這些
    的頭像 發表于 03-25 09:29 ?198次閱讀
    樹莓派 也能搞 AI 藝術?樹莓派遇上<b class='flag-5'>DALL-E</b>,開啟你的 AI 藝術創作之旅!

    ChirpIoT技術的優勢以及局限性

    無線通信技術。相關產品型號有E29-400T22D、E290-400MM20S、E290-900T20S、E290-400T30S等國產lora模塊,該系列無線模塊相關性能參數和功能特
    的頭像 發表于 01-23 10:42 ?381次閱讀

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統是一種特殊的系統,它通常被嵌入到其他設備或機器中,以實現特定功能。嵌入式系統具有非常強的適應性和靈活性,能夠根據用戶需求進行定制化設計。它廣泛應用于各種
    發表于 11-14 16:39

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    的效率,還為科學研究提供了前所未有的洞察力和精確度。例如,在生物學領域,AI能夠幫助科學家快速識別基因序列中的關鍵變異,加速新藥研發進程。 2. 跨學科融合的新范式 書中強調,人工智能的應用促進了多個
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發表于 09-28 11:00

    D類放大器上僅電容EMI濾波器的局限性

    電子發燒友網站提供《D類放大器上僅電容EMI濾波器的局限性.pdf》資料免費下載
    發表于 09-14 10:44 ?0次下載
    D類放大器上僅電容EMI濾波器的<b class='flag-5'>局限性</b>

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料。看能否有助于入門和提高ss
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    大力發展AI for Science的原因。 第2章從科學研究底層的理論模式與主要困境,以及人工智能三要素(數據、算法、算力)出發,對AI for Science的技術支撐進行解讀。 第3章介紹了在
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產品
    發表于 08-22 15:00

    微通道反應器目前的局限性

    ,可以實現物料的瞬間均勻混合和高效的傳熱,因此許多在常規反應器中無法實現的反應都可以微反應器中實現。 從結構特點上來說,目前微通道反應器應用與局限性如下 1. 反應本身速度很快,但受制于傳遞過程的,整體反應速度偏
    的頭像 發表于 08-12 14:23 ?609次閱讀

    WDM技術的缺點和局限性

    和效率。然而,盡管WDM技術具有諸多優勢,但它也存在一些缺點和局限性。以下是對WDM技術缺點和局限性的詳細分析:
    的頭像 發表于 08-09 11:42 ?1418次閱讀

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    谷歌開發出高精度人工智能天氣模擬器

    谷歌最新研發的高精度人工智能天氣模擬器,正引領著氣象預測技術的新一輪革新。該項目的核心在于將標準的物理驅動模型與先進的機器學習工具巧妙結合,旨在克服單一依賴人工智能可能帶來的局限性與不確定性。
    的頭像 發表于 07-27 16:20 ?2418次閱讀