女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

生成式 AI 研究通過引導式圖像結構控制為創作者賦能

NVIDIA英偉達 ? 來源:未知 ? 2023-07-24 19:30 ? 次閱讀

新的研究正在通過一個文本引導的圖像編輯工具來提升生成式 AI 的創造性潛能。這項創新性的研究提出了一個使用即插即用擴散特征(PnP DFs)的框架,可引導實現逼真而精確的圖像生成。通過這項研究,視覺內容創作者只需一張提示圖片和幾個描述性詞語,就能將圖像轉化為視覺內容。

可靠輕松編輯并生成內容的能力有助于藝術家、設計師和創作者不斷擴展創意的可能性。這也將為那些依賴動畫、視覺設計和圖像編輯的行業賦能。

這項研究的首席作者、魏茲曼科學研究院博士研究生 Narek Tumanyan 表示:“最新的文本到圖像生成模型標志著數字內容創作進入了一個新時代。然而,將它們應用于現實世界的主要挑戰在于缺乏用戶可控性,這在很大程度上局限于‘僅通過輸入文本來引導圖像生成’。我們的工作是最早為用戶提供圖像布局控制權的方法之一?!?/p>

生成式 AI 的最新突破為開發強大的文本到圖像模型提供了新方法。然而,復雜性、模糊性以及對定制內容的需求限制了當前渲染技術的發展。

這項研究引入了一種新方法,使用 PnP DFs 來改進圖像編輯和生成過程,使創作者對最終產物有更大的控制權。

研究人員從一個簡單的問題入手:擴散模型如何表現并捕捉圖像的形狀或輪廓?研究探索了圖像在生成過程中不斷演變的內部表征,并研究了這些表征如何對形狀和語義信息進行編碼。

這種新方法通過理解如何在預訓練的文本到圖像模型中編碼空間信息來控制生成的圖像布局,而無需訓練新的擴散模型或對其進行微調。在生成過程中,模型從引導圖像中提取擴散特征,并將其注入到整個過程中的每一個步驟,從而對新圖像的結構進行精細控制。

通過融合這些空間特征,擴散模型可以完善新圖像,使其與引導結構相匹配。它會反復進行此過程,更新圖像特征,直到生成一張既保留引導圖像布局、又與文本提示相匹配的最終圖像。

作者寫道:“這就產生了一種簡單而有效的方法,即從引導圖像中提取的特征直接注入到轉化圖像的生成過程中,無需進行訓練或微調。”

這種方法為更先進的可控生成和操作方法鋪平了道路。

視頻. 在 2023 年國際計算機視覺與模式識別會議(CVPR)上展示的“文本驅動的圖像到圖像翻譯的即插即用擴散特征”研究概述

研究人員使用 cuDNN 加速的 PyTorch 框架在單個 NVIDIA A100 GPU 上開發并測試了這個 PNP 模型。該團隊表示,GPU 的大容量使他們能夠專注于開發方法。作為 NVIDIA 應用研究加速器計劃的參與者,這些研究人員獲得了一塊 A100 GPU。

該框架部署在 A100 上,能夠在大約 50 秒內從引導圖像和文本轉換為一個新圖像。

該過程不僅有高效,而且可靠,能準確地生成令人驚嘆的圖像。除圖像外,它還適用于轉化草圖、繪圖和動畫,并能修改照明、色彩和背景。

圖 1.該方法的示例結果,保留了引導折紙圖像的結構,同時與目標提示的描述相匹配(來源:Tumanyan, Narek 等人/CVPR 2023)

他們的方法還優于現有的文本到圖像模型,在保留引導布局和偏離其外觀之間實現了卓越的平衡。

圖 2.示例結果,將該模型與 P2P、DiffuseIT、SDedit 和 VQ+CLIP 模型進行三種不同噪聲水平的比較(來源:Tumanyan, Narek 等人/CVPR 2023)

然而,該模型確實存在一些局限性。當編輯任意顏色的圖像區域時,它的表現并不理想,因為該模型無法從輸入圖像中提取語義信息。

目前,研究人員正在致力于將這種方法擴展到文本引導的視頻編輯中。同時,該研究還證明對于其他利用擴散模型分析圖像內部表征的研究也具有重要價值。

例如,有一項研究正在利用該團隊的研究成果來改進計算機視覺任務,例如語義點對應。另一項研究則專注于擴展文本到圖像生成的控制,包括物體的形狀、位置和外觀。

這項研究已在 GitHub 上開源。

點擊“閱讀原文”,或掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創始人兼 CEO 黃仁勛在 SIGGRAPH 現場發表的 NVIDIA 主題演講,了解 NVIDIA 的新技術,包括屢獲殊榮的研究,OpenUSD 開發,以及最新的 AI 內容創作解決方案。


原文標題:生成式 AI 研究通過引導式圖像結構控制為創作者賦能

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3910

    瀏覽量

    93023

原文標題:生成式 AI 研究通過引導式圖像結構控制為創作者賦能

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    富士通如何解鎖生成AI紅利 從人才進化到業務

    生成AI技術正以每周迭代一次的速度重塑商業世界。利用生成AI,營銷部門10分鐘就可以產出百張
    的頭像 發表于 02-25 17:32 ?708次閱讀

    生成AI工具好用嗎

    當下,生成AI工具正以其強大的內容生成能力,為用戶帶來了前所未有的便捷與創新。那么,生成
    的頭像 發表于 01-17 09:54 ?355次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?697次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數據的人工智能技術。在此,petacloud.
    的頭像 發表于 10-28 11:19 ?594次閱讀

    商湯日日新大模型體系持續升級,為全行業創作者提供新質生產力

    AIGC帶來的可能性不僅為創作者提供了廣闊的創作空間,也帶來了嶄新的藝術形式和語言。
    的頭像 發表于 09-26 10:18 ?725次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑
    的頭像 發表于 08-30 16:23 ?1454次閱讀

    索尼電影攝影機助力創作者實現影像夢想

    索尼一直致力于通過創新技術,忠實還原創作者的意圖,憑借在廣播電視及專業影像業務中深厚的技術積累,助力創作者實現影像夢想,用創意和科技的力量感動世界。
    的頭像 發表于 08-16 10:54 ?929次閱讀

    亞馬遜云科技Shulex打造基于生成AI的客服和消費者洞察

    "Shulex")在亞馬遜云科技的技術下,打造基于生成AI的"AI Agent客服機器人"
    的頭像 發表于 08-13 20:38 ?479次閱讀

    索尼推出專為視頻內容創作者量身定制的相機——ZV-E10 II

    7月11日最新資訊,索尼公司正式揭曉了其專為視頻內容創作者量身定制的相機新品——ZV-E10 II,作為ZV-E10系列的升級版,該機在承襲前代深受喜愛的特性的基礎上,融入了諸多創新元素,旨在進一步滿足視頻博主日益精細化的創作需求。
    的頭像 發表于 07-11 16:42 ?789次閱讀

    如何用C++創建簡單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術,它通過機器學習模型和深度學習技術,從大量歷史數據中學習對象的特征和規律,從而能夠
    的頭像 發表于 07-05 17:53 ?1512次閱讀

    生成AI的定義和特征

    行為,生成全新的、具有實際意義的數據或內容。這種技術已經在自然語言處理、圖像生成、音頻合成等多個領域展現出巨大的潛力和應用價值。本文將詳細探討生成
    的頭像 發表于 07-05 17:33 ?2309次閱讀

    生成AI的基本原理和應用領域

    生成人工智能(Generative Artificial Intelligence,簡稱Generative AI)是一種利用機器學習算法和深度學習技術,通過模擬人類的創造性思維過程
    的頭像 發表于 07-04 11:50 ?2918次閱讀

    商湯發布《2024生成AI教育未來》白皮書

    生成AI正在各個行業中展現出巨大的應用前景。在關系國計民生的教育行業,生成AI能夠催生哪些創
    的頭像 發表于 06-29 09:48 ?1266次閱讀

    Runway發布Gen-3 Alpha視頻生成模型

    專為電影和圖像內容創作者提供生成AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻
    的頭像 發表于 06-19 09:25 ?770次閱讀

    原來這才是【生成AI】??!

    人工智能按照用途進行簡單分類的話,AI其實要被劃分為兩類:決策AI生成AI。決策
    的頭像 發表于 06-05 08:04 ?290次閱讀
    原來這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】?。? />    </a>
</div>                    </div>
                    <div   id=