NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和 NVIDIA Jetson 加速運(yùn)行。
Black Forest Labs,作為全球頂尖 AI 研究實(shí)驗(yàn)室之一,剛剛為圖像生成領(lǐng)域帶來(lái)顛覆性變革。
該實(shí)驗(yàn)室的 FLUX.1 圖像模型憑借高質(zhì)量視覺輸出和優(yōu)秀的提示詞遵循度,引發(fā)全球業(yè)界關(guān)注。現(xiàn)在,通過推出其最新FLUX.1 Kontext 模型,該實(shí)驗(yàn)室從根本上改變了用戶引導(dǎo)和優(yōu)化圖像生成過程的方式。
為了獲得預(yù)期效果,AI 藝術(shù)家們通常需要整合多個(gè)模型架構(gòu)并配合 ControlNets 模塊,而這些 AI 模型有助于引導(dǎo)圖像生成器的輸出。這通常需要結(jié)合多個(gè) ControlNets 或采用更高級(jí)的技術(shù),例如 NVIDIA AI Blueprint 中推出的 3D 引導(dǎo)圖像生成,這種方法通過 3D 場(chǎng)景粗稿確定圖像構(gòu)成。
全新 FLUX.1 Kontext 模型通過單一模型實(shí)現(xiàn)自然語(yǔ)言驅(qū)動(dòng)的圖像生成與編輯,大幅簡(jiǎn)化了工作流程。
NVIDIA 已與 Black Forest Labs 達(dá)成合作,通過NVIDIA TensorRT及量化技術(shù)對(duì) FLUX. 1 Kontext [dev] 進(jìn)行深度優(yōu)化,使其在NVIDIA RTX GPU上實(shí)現(xiàn)更快的推理速度與更低的 VRAM 顯存需求。
對(duì)于創(chuàng)作者和開發(fā)者而言,通過 TensorRT 優(yōu)化,RTX 設(shè)備可帶來(lái)更快的編輯速度、更流暢的迭代和更強(qiáng)大的控制。
FLUX.1 Kontext [dev]:語(yǔ)境感知圖像生成
Black Forest Labs 于五月推出 FLUX.1 Kontext 系列圖像模型,該模型同時(shí)接受文本和圖像提示。
該系列模型支持用戶基于參考圖像進(jìn)行創(chuàng)作,并使用簡(jiǎn)單的語(yǔ)言進(jìn)行編輯,無(wú)需通過微調(diào)或使用多 ControlNet 的復(fù)雜工作流。
FLUX.1 Kontext 是一種專為圖像編輯構(gòu)建的開放式生成模型,其引導(dǎo)式、逐步生成架構(gòu)支持從局部細(xì)節(jié)到全局場(chǎng)景轉(zhuǎn)換的精準(zhǔn)控制。由于該模型接受文本和圖像雙輸入,讓用戶可以輕松引用視覺概念,并以自然、直觀的方式引導(dǎo)其創(chuàng)作。這可以實(shí)現(xiàn)連貫且高質(zhì)量的圖像編輯,同時(shí)忠實(shí)于原始概念。
FLUX.1 Kontext 的關(guān)鍵功能包括:
角色一致性:確保人物特征在多鏡頭多視角下保持統(tǒng)一。
局部編輯:在不改變圖像其他部分的情況下,修改特定元素。
風(fēng)格遷移:將參考圖像的風(fēng)格和氛圍應(yīng)用于新場(chǎng)景。
實(shí)時(shí)性能:低延遲生成支持快速迭代和反饋。
Black Forest Labs 先前正式在 Hugging Face 平臺(tái)上發(fā)布 FLUX.1 Kontext 模型權(quán)重,并同步推出經(jīng)過 TensorRT 加速優(yōu)化的專用版本。
三組對(duì)照?qǐng)D像展示了 FLUX.1 Kontext [dev] 的多輪編輯能力:同一餐桌場(chǎng)景經(jīng)多次修改,但始終保留原始花卉元素。原始圖像 (左);首次編輯將其轉(zhuǎn)換為包豪斯風(fēng)格的圖像 (中);第二次編輯采用柔和色調(diào)的調(diào)色板改變了圖像的色彩風(fēng)格 (右)。
傳統(tǒng)上,高級(jí)圖像編輯需要復(fù)雜的指令,并且難以創(chuàng)建遮罩層、深度圖或邊緣圖。FLUX.1 Kontext [dev] 引入了一種更加直觀且靈活的界面,將逐步編輯與用于擴(kuò)散模型推理的尖端優(yōu)化相結(jié)合。
[dev] 模型強(qiáng)調(diào)靈活性與控制力。該系統(tǒng)支持角色一致性、風(fēng)格保留和局部圖像調(diào)整等功能,并集成了 ControlNet 功能,實(shí)現(xiàn)結(jié)構(gòu)化視覺提示。
FLUX.1 Kontext [dev] 現(xiàn)已登陸 ComfyUI 及 Black Forest Labs Playground 平臺(tái),其搭載 NVIDIA NIM 微服務(wù)版本預(yù)計(jì)將于八月正式發(fā)布。
專為 RTX 優(yōu)化并采用 TensorRT 加速技術(shù)
FLUX.1 Kontext [dev] 通過簡(jiǎn)化復(fù)雜的工作流程來(lái)加速創(chuàng)意。為了進(jìn)一步簡(jiǎn)化工作并擴(kuò)大可訪性,NVIDIA 與 Black Forest Labs 合作:通過模型量化,降低 VRAM 顯存需求,使更多用戶能在本地運(yùn)行該模型,并采用 TensorRT 對(duì)其進(jìn)行優(yōu)化,使其性能翻倍。
量化處理后,F(xiàn)P8 的模型大小從 24GB 減小至 12GB (Ada),F(xiàn)P4 的模型大小從 24GB 減小至 7GB (Blackwell)。
TensorRT 是一個(gè)利用 NVIDIA RTX GPU 中 Tensor Core 實(shí)現(xiàn)最大化性能的框架,與使用 PyTorch 運(yùn)行原始 BF16 模型相比,能夠提供超過兩倍的加速效果。
敬請(qǐng)?jiān)L問 NVIDIA 技術(shù)博客,了解更多關(guān)于 NVIDIA 優(yōu)化以及 FLUX.1 Kontext [dev] 入門指南。
開始使用 FLUX.1 Kontext
FLUX.1 Kontext [dev] 可在 Hugging Face(Torch 和 TensorRT)平臺(tái)下載。
對(duì)這些模型測(cè)試感興趣的 AI 愛好者可以下載 Torch 版本,并在 ComfyUI 平臺(tái)上部署使用。Black Forest Labs 還提供一個(gè)在線測(cè)試平臺(tái)用于測(cè)試該模型:
針對(duì)高級(jí)用戶和開發(fā)者,NVIDIA 正在開發(fā)示例代碼,方便將 TensorRT 流水線輕松集成到工作流程中。請(qǐng)?jiān)诒驹潞笃诓榭?DemoDiffusion 倉(cāng)庫(kù)。
等等,還不止這樣
Google 前不久宣布推出 Gemma 3n,這是一款新型多模態(tài)小語(yǔ)言模型,非常適合在用于邊緣 AI 和機(jī)器人技術(shù)的 NVIDIA Jetson 平臺(tái)上運(yùn)行。
AI 愛好者可以在 Ollama 和 llama.cpp 框架中,借助 RTX 加速,使用 Gemma 3n 模型,并通過他們喜歡的應(yīng)用程序,比如 AnythingLLM 和 LM Studio,輕松體驗(yàn)和開發(fā) AI 功能。
此外,開發(fā)者可通過 Ollama 框架輕松部署 Gemma 3n 模型,并充分利用 RTX 加速優(yōu)勢(shì)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106362 -
AI
+關(guān)注
關(guān)注
88文章
35117瀏覽量
279659 -
模型
+關(guān)注
關(guān)注
1文章
3519瀏覽量
50416
原文標(biāo)題:AI 修圖神器!NVIDIA RTX AI 加速 FLUX.1 Kontext 現(xiàn)已開放下載
文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比
NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型
NVIDIA和GeForce RTX GPU專為AI時(shí)代打造
NVIDIA亮相微軟Ignite技術(shù)大會(huì)
NVIDIA RTX AI Toolkit擁抱LoRA技術(shù)

評(píng)論