最近來自馬克斯?普朗克計算機科學研究所、MIT CSAIL和谷歌的研究者們研究了一種控制GAN的新方法DragGAN,這項技術的特點是,用戶只要點擊拖拽,就可以“改變汽車的尺寸或者將人物的笑容變成皺眉”。
其中演示的案例包括增加山峰的高度、改變模特的姿勢和衣服的長度以及形狀、張開或閉合獅子的嘴巴、將一個人的表情從平淡變成微笑等。
DragGAN是一個直觀的圖像編輯工具PM系統,用戶只需要控制圖像中的像素點和方向,就可以快速調整照片主體的位置、姿態、表情、大小和角度等。
而根據他們的說法,他們的方法是基于GAN的操作中優于SOTA,并為圖像編輯開辟了新方向。
這種工具的潛力主要表現在,從文本生成圖像的人工智能并不總是能輸出你想要的結果,同時用戶還可以在生成圖像之后再進行重新編輯,而且不用重新生成新的圖像。
以上源自互聯網,版權歸原作所有
審核編輯黃宇
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
87文章
34093瀏覽量
275206
發布評論請先 登錄
相關推薦
熱點推薦
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支持,即可完成目標或其他自研大模型輕松部署。讓AI
發表于 04-13 19:52
開源的AI MPU
1. 基于RISC-V的開源AI MPU/加速器 ? ?**(1) SiFive Intelligence系列**? ? 特點 ?:SiFive提供開源的RISC-V IP核,支持AI
聲云AI語音鼠標開啟智能辦公新時代
在數字化飛速發展的當下,人們對輸入設備的效率和便捷性有了更高的追求。傳統鼠標只能實現基本的指針控制,在文字輸入場景下,鍵盤輸入速度受限且在特殊環境中使用不便。而聲云 AI 語音鼠標方案的問世,正是為了滿足用戶對高效、便捷輸入的迫
Banana Pi 與瑞薩電子攜手共同推動開源創新:BPI-AI2N
對技術創新的共同追求,也為開源硬件行業的發展帶來了更多可能性。BPI-AI2N & BPI-AI2N Carrier 將在 2025年3月11日-13日德國紐倫堡嵌入式世界展會
發表于 03-12 09:43
AI潮流下的辦公“神器”選擇,沸蛇AI語音鼠標真正實現效率翻倍
年終臨近,各種考核、匯報、總結也隨之而來,忙上天的白領們不得閑暇。事實上,許多流程化、模板化的工作并非困難模式,只是處理起來比較費時,這個時候AI就可以幫上忙。沸蛇AI語音鼠標就是一款能夠幫助辦公

字節發布SeedEdit圖像編輯模型
,SeedEdit模型憑借其強大的技術實力,支持用戶通過一句簡單的自然語言描述,即可輕松實現對圖像的多種編輯操作。無論是修圖、換裝、美化,還是轉化風格、在指定區域添加或刪除元素等復雜任
Llama 3 與開源AI模型的關系
在人工智能(AI)的快速發展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術的創新,還促進了全球開發者社區的合作。Llama 3,作為一個新興的
Freepik攜手Magnific AI推出AI圖像生成器
近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著AI
AI辦公鼠標推薦:唯有科大訊飛鼠標AM30,才能真正體驗到AI智慧
唯有科大訊飛鼠標AM30,才能真正體驗到AI帶來的驚喜與便利 AI時代,一切都在飛速發展,效率成為了成功的關鍵。你還在用傳統鼠標,一字一句敲打著鍵盤,熬夜趕方案、做PPT? 醒醒吧!科

微軟AI新成果:將不可編輯PDF轉化為可編輯文檔
市面現有相關軟件雖能將PDF轉為可編輯版,但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統》,其獨特之處在于運用AI技術
評論