AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個挑戰(zhàn):實現(xiàn)創(chuàng)意掌控。
使用文本創(chuàng)建場景變得更容易,不再需要復(fù)雜的描述,模型也改進了針對提示詞的一致性。但僅通過文字描述構(gòu)圖、拍攝角度、物體擺放這些精細細節(jié)已經(jīng)很不容易了,要修改調(diào)整更是難上加難。雖然使用 ControlNet(通過更好地控制輸出來增強圖像生成的工具)的高級工作流提供了解決方案,但其設(shè)置復(fù)雜,限制了更廣泛的使用。
為幫助克服這些挑戰(zhàn)并快速獲取先進的 AI 功能,NVIDIA 在年初的 CES 展會上發(fā)布了面向 RTX PC 的NVIDIA 3D 引導(dǎo)生成式 AI Blueprint。這個示例工作流包含了全套工具,讓你能從頭開始生成完全控制構(gòu)圖的圖像。用戶現(xiàn)在就可以體驗這個全新的 Blueprint。
利用 3D 控制 AI 生成的圖像
NVIDIA 的3D 引導(dǎo)生成式 AI Blueprint可控制圖像生成,它使用 Blender 中的 3D 場景草稿向圖像生成器(Black Forest Labs 的 FLUX.1-dev)提供深度圖,與用戶的提示詞一起生成所需的圖像。
深度圖幫助圖像模型理解物體應(yīng)該如何放置。這項技術(shù)的優(yōu)勢在于,它不需要高度細節(jié)化的物體或高質(zhì)量紋理,因為它們將被轉(zhuǎn)換為灰度。此外,由于場景是 3D 的,用戶可以輕松移動物體并更改相機角度。
Blueprint 的底層是 ComfyUI,這是一個功能強大的工具,允許創(chuàng)作者以有趣的方式鏈接生成式 AI 模型。例如,用戶可以通過 ComfyUI Node Editor Blender 插件將 Blender 連接到 ComfyUI。此外,用戶可以使用NVIDIA NIM 微服務(wù)在 GeForce RTX GPU 上部署 FLUX.1-dev 模型并以最佳性能運行,充分利用 NVIDIA TensorRT 軟件開發(fā)套件以及 FP4 和 FP8 等優(yōu)化的精度格式。3D 引導(dǎo)的生成式 AI Blueprint 需要 NVIDIA GeForce RTX 4080 及以上 GPU。
生成式 AI 工作流的預(yù)構(gòu)建基礎(chǔ)
3D 引導(dǎo)的生成式 AI Blueprint 包括開始使用高級圖像生成工作流所需的一切:Blender、ComfyUI、連接兩者的 Blender 插件、FLUX.1-dev NIM 微服務(wù)以及運行該微服務(wù)所需的 ComfyUI 節(jié)點。對于 AI 藝術(shù)家,還附帶了安裝程序和詳細的部署說明。
該 Blueprint 采用一種結(jié)構(gòu)化的方式來深入圖像生成,提供了可根據(jù)特定需求量身定制的工作流。這套方案包含了手把手教程、現(xiàn)成素材和開箱即用的環(huán)境配置,讓你創(chuàng)作更輕松,效果更驚艷。
對于 AI 開發(fā)者,該 Blueprint 可以作為構(gòu)建類似工作流或擴展現(xiàn)有工作流的基礎(chǔ)。它附帶源代碼、示例數(shù)據(jù)、文檔和入門工作示例。
RTX AI 提供支持的實時生成
AI Blueprint 在 NVIDIA RTX AI PC 和工作站上運行,充分利用了 NVIDIA Blackwell 架構(gòu)的最新性能突破。
3D 引導(dǎo)的生成式 AI Blueprint中包含的 FLUX.1-dev NIM 微服務(wù)經(jīng)過 TensorRT 優(yōu)化,并量化為 FP4 精度以適用于 Blackwell GPU,推理速度比原生 PyTorch FP16 提升了一倍以上。
對于使用 NVIDIA Ada Lovelace 架構(gòu) GPU 的用戶,F(xiàn)LUX.1-dev NIM 微服務(wù)附帶 FP8 精度,同樣由 TensorRT 加速。這些改進使高性能工作流更容易實現(xiàn),從而能夠進行快速迭代和實驗。量化還有助于減少模型運行所需的顯存。使用 FP4 量化時,模型體積直接比 FP16 小了一半還多。
使用 RTX AI 進行定制和創(chuàng)建
目前有 10 個 NIM 微服務(wù)可用于 RTX,支持從圖像和文本生成到語音 AI 和計算機視覺的用例,更多 Blueprint 和服務(wù)即將推出。
AI Blueprint 和 NIM 微服務(wù)現(xiàn)已推出,為準(zhǔn)備在 RTX PC 和工作站上創(chuàng)建、定制和突破生成式 AI 界限的用戶提供了強大的基礎(chǔ)。
-
3D
+關(guān)注
關(guān)注
9文章
2952瀏覽量
109484 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5246瀏覽量
105791 -
AI
+關(guān)注
關(guān)注
87文章
34294瀏覽量
275476
原文標(biāo)題:借助 NVIDIA 的 3D 引導(dǎo)生成式 AI Blueprint 控制 AI 圖像的構(gòu)圖
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA助力影眸科技3D生成工具Rodin升級
騰訊混元3D AI創(chuàng)作引擎正式上線
NVIDIA推出多個生成式AI模型和藍圖
NVIDIA 推出高性價比的生成式 AI 超級計算機

NVIDIA推出全新生成式AI模型Fugatto
NVIDIA助力Amdocs打造生成式AI智能體
使用全新NVIDIA AI Blueprint開發(fā)視覺AI智能體
生成式AI工具作用
NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展
Freepik攜手Magnific AI推出AI圖像生成器
使用NVIDIA Edify助力的服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明
歡創(chuàng)播報 騰訊元寶首發(fā)3D生成應(yīng)用

評論