以下文章來源于Radxa ,作者瑞莎
Stable Diffusion 3 Medium 是一種多模態(tài)擴(kuò)散變換器 (MMDiT) 文本到圖像模型,在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。
目前瑞莎團(tuán)隊(duì)使用 Stable Diffusion 3 Medium 開源模型,通過 SOPHON SDK 移植到 SG2300X 處理器系列產(chǎn)品上進(jìn)行本地 TPU 硬件加速推理,實(shí)現(xiàn)在 radxa Airbox 上離線快速生成特色風(fēng)格且?guī)逦谋镜膱D片。
有關(guān) Stable Diffusion 3 Medium 更多技術(shù)細(xì)節(jié),請(qǐng)參閱官方網(wǎng)站和研究論文。

Stable diffusion 3 模型架構(gòu)
環(huán)境準(zhǔn)備
硬件準(zhǔn)備
將網(wǎng)線根據(jù)您的網(wǎng)絡(luò)環(huán)境選擇插入 WAN 口(推薦接入廣域網(wǎng))或者 LAN 口(接入局域網(wǎng)),根據(jù)您的使用習(xí)慣可選將 Type-C 數(shù)據(jù)線 C 口端插入 Airbox Debug 口, A 口端插入至您的 PC,最后插入電源上電自動(dòng)開機(jī),更多詳細(xì)關(guān)于硬件準(zhǔn)備工作請(qǐng)參考這里
軟件環(huán)境準(zhǔn)備
針對(duì)熟練度不同的 Linux 開發(fā)者,可以選擇兩種方式進(jìn)行環(huán)境準(zhǔn)備。因 Airbox 鏡像已經(jīng)預(yù)裝 CasaOS,所以本文以 CasaOS 命令行模式為例子進(jìn)行部署 Stable Diffusion 3
- 終端命令行模式
- CasaOS 命令行模式(新手推薦)
開啟終端
待 Airbox 開機(jī)后,通過您的 PC 瀏覽器訪問 Airbox 的 IP 地址的 81 端口便可登錄 CasaOS,如何獲取 Airbox IP 地址?請(qǐng)參考這里
CasaOS 用戶名和密碼
Username:radxaPassword: radxa
Airbox 系統(tǒng)終端用戶名和密碼
Username: linaroPassword: linaro
點(diǎn)擊 CasaOS 左上角第三個(gè)圖標(biāo)登陸 Airbox 系統(tǒng)終端
CasaOS 終端登陸界面
代碼環(huán)境準(zhǔn)備
終端打開后,接下來就直接復(fù)制提供的命令就好
克隆 SD3-Medium-TPU 代碼倉庫
cd /datagit clone https://github.com/zifeng-radxa/SD3-Medium-TPU.git && cd SD3-Medium-TPU
配置運(yùn)行環(huán)境(僅需運(yùn)行一次) 此腳本會(huì)自動(dòng)配置所需運(yùn)行依賴的庫,請(qǐng)耐心等待安裝
source env.sh
下載 radxa 提供好的 Stable Diffusion 3 bmodel 格式模型
如果您可以流暢訪問 github, 可直接運(yùn)行 run.sh 腳本, 這會(huì)自動(dòng)從 github 上下載模型后并啟動(dòng)程序
bash run.sh
如果你出現(xiàn)下載的壓縮包 md5 比對(duì)不過可以通過模型下載腳本重新下載
bash tar_downloader.sh
如果您無法使用 github 下載,radxa 提供百度云鏈接,請(qǐng)將下載好的 models 文件夾拷貝到 Airbox 上 SD-Medium-TPU/python_demo 文件夾中,您可以直接通過 CasaOS 文件管理器中直接上傳至 Airbox
啟動(dòng) Stable Diffusion 3 Gradio 服務(wù)確保下載好模型好啟動(dòng)服務(wù)
bash run.sh
啟動(dòng)后在您的 PC 瀏覽器訪問 Airbox IP 的 8999 端口即可訪問 Stable Diffusion3 Gradio 服務(wù)
Stable Diffusion3 Gradio 服務(wù)界面
使用示例
點(diǎn)擊右上角 Load Model 加載模型
因?yàn)槟P徒咏?10G 如果您的模型存放在 emmc 中,加載速度會(huì)比較慢,可以選擇存放在 SSD 中
在 CasaOS 終端中可以看到各個(gè)模型的加載細(xì)節(jié), SSD 中加載模型需要 37 秒
read file models/mmdit.bmodel, size 100000, duration 0.000318, speed 0.292869 GB/s[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/mmdit.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_g.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 14[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_l.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 34[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/t5.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/vae_decoder.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 1Youset`add_prefix_space`.Thetokenizerneedstobeconvertedfromtheslowtokenizers
填入Prompt信息
- 在 Prompt 填入英文提示詞,比如
A cat with a sign text Welcome to radxa!
- 可選填入 Negative Prompt 反向提示詞(輸入不想出現(xiàn)的物體)
deformed, lowres, bad anatomy, error, extra digit, fewer digits, cropped, worst quality, low quality, jpeg artifacts, signature, watermark, username, blurry, artist name
選擇合理的步數(shù)和 CFG值,可選 clip skip(跳過模型推理的最后層數(shù),建議為0)和隨機(jī)種子,最后點(diǎn)擊 Submit 按鈕開始生成任務(wù),生成的圖片結(jié)果會(huì)直接顯示在右邊,點(diǎn)擊下載圖標(biāo)可自行下載
終端中會(huì)打印運(yùn)行進(jìn)度,可見平均每個(gè) step 需要 2.93s
set seed to: 15>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%|████████████████████████████████████████████████████████████████████|28/28[01:22<00:00,??2.93s/it]
-
變換器
+關(guān)注
關(guān)注
17文章
2130瀏覽量
110397 -
圖像
+關(guān)注
關(guān)注
2文章
1092瀏覽量
41020 -
模型
+關(guān)注
關(guān)注
1文章
3486瀏覽量
49988
發(fā)布評(píng)論請(qǐng)先 登錄
Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

電工操作實(shí)操柜
Stability AI開源圖像生成模型Stable Diffusion
大腦視覺信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!“人類的謀略和謊言不存在了”
大腦視覺信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!
一文讀懂Stable Diffusion教程,搭載高性能PC集群,實(shí)現(xiàn)生成式AI應(yīng)用

使用OpenVINO?在算力魔方上加速stable diffusion模型

優(yōu)化 Stable Diffusion 在 GKE 上的啟動(dòng)體驗(yàn)
iPhone兩秒出圖,目前已知的最快移動(dòng)端Stable Diffusion模型來了

使用OpenVINO在Stable Diffusion V2.1上實(shí)現(xiàn)AI硬件加速的方法

樹莓派能跑Stable Diffusion了?
Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

PCB設(shè)計(jì)如何在實(shí)操中規(guī)范的布局

評(píng)論