Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而Stable Diffusion是許多其他文本到圖像生成AI工具的基礎(chǔ)。
Stable Cascade可以生成照片并提供其創(chuàng)建的確切圖像的變體,或者嘗試提高現(xiàn)有圖片的分辨率。其他文本到圖片的編輯功能還包括圖像修復(fù)和外畫(模型只對圖片的特定部分進(jìn)行填充編輯),以及可視邊緣(用戶可利用現(xiàn)有圖片的邊緣制作新照片)。
新模型可在GitHub上供研究人員使用,但不能用于商業(yè)用途。在谷歌甚至蘋果等公司發(fā)布自己的圖像生成模型時(shí),新模型也帶來了更多選擇。
與Stability的旗艦Stable Diffusion模型不同,Stable Cascade不是一個(gè)大型語言模型,而是三個(gè)依賴于Würstchen架構(gòu)的不同模型。
Comparison of inference time Stable Cascade v other models,Stability AI
將請求分解成更小的比特后,請求所需的內(nèi)存更少(在那些很難找到的GPU上訓(xùn)練的時(shí)間也更少),運(yùn)行速度更快,同時(shí)在"提示對齊和美學(xué)質(zhì)量"方面表現(xiàn)更佳。創(chuàng)建一幅圖像大約需要10秒,而目前使用的SDXL模型需要22秒。
Stability AI公司幫助普及了Stable Diffusion方法,同時(shí)也成為了幾起訴訟的對象,指控Stable Diffusion在未經(jīng)權(quán)利持有人許可的情況下對受版權(quán)保護(hù)的數(shù)據(jù)進(jìn)行訓(xùn)練。該公司于12月開始通過訂閱的方式提供商業(yè)許可,并表示這是幫助其研究獲得資金所必需的。
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1806文章
48996瀏覽量
249196 -
語言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10784 -
圖像生成
+關(guān)注
關(guān)注
0文章
25瀏覽量
7034
原文標(biāo)題:Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
全球AI競賽格局:美國能否持續(xù)保持創(chuàng)新領(lǐng)先地位
我國生成式人工智能的發(fā)展現(xiàn)狀與趨勢
生成式人工智能模型的安全可信評測

評論