女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出能一次生成完整視頻的擴散模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-01-29 11:14 ? 次閱讀

谷歌研究院近日發布了一款名為Lumiere的文生視頻擴散模型,基于自家研發的Space-Time U-Net基礎架構,獨立生成具有高效、完整且動作連貫性的視頻效果。

該公司指出,當前眾多文生視頻模型普遍存在無法生成長時、高品質及動作連貫的問題。這些模型往往采用“分段生成視頻”策略,即先生成少量關鍵幀,再借助時間超級分辨率(TSM)技術生成其間的視頻文件。盡管此策略可減緩RAM負擔,但難以生成理想的連續視頻效果。

針對此問題,谷歌的Lumiere模型創新地引入了新型Space-Time U-Net基礎架構,這種架構能在空間和時間兩個維度同時降低信號采樣率,使其具備更高的計算效率,進而實現生成更具持續性、動作連貫的視頻效果。

此外,開發者們特別說明,Lumiere每次可生成80幀視頻(在16FPS模式下相當于5秒視頻,或在24FPS模式下為約3.34秒視頻)。盡管這一時光貌似短暫,然而他們強調,事實上,這段5秒視頻所包含的鏡頭時長已超出大多數媒體作品中單一鏡頭的平均時長。

除運用架構創新以外,作為AI構建基礎的預訓練文生圖像模型也得到了谷歌團隊的特別關注。該模型首次生成簡單像素草稿作為視頻分幀,然后借助空間超分辨率(SRM)模型,逐步提高分幀分辨率,同時引入通用生成框架Multi-Diffusion以增強模型穩定性,從而確保最終輸出的視頻效果一致且連續。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6224

    瀏覽量

    107600
  • RAM
    RAM
    +關注

    關注

    8

    文章

    1391

    瀏覽量

    116860
  • AI
    AI
    +關注

    關注

    88

    文章

    34377

    瀏覽量

    275581
  • 模型
    +關注

    關注

    1

    文章

    3499

    瀏覽量

    50049
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    字節跳動即將推出多模態視頻生成模型OmniHuman

    完整的AI視頻。 據即夢AI相關負責人透露,OmniHuman模型在研發過程中融入了前沿的人工智能技術,通過復雜的算法和深度學習機制,實現了圖片與音頻的精準匹配和
    的頭像 發表于 02-08 10:53 ?663次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新代旗艦大模型 Gemini 2.0 P
    的頭像 發表于 02-07 15:07 ?644次閱讀

    阿里云通義萬相2.1視頻生成模型震撼發布

    近日,阿里云旗下的通義萬相迎來了重要升級,正式推出了全新的萬相2.1視頻生成模型。這創新成果標志著阿里云在視頻生成技術領域的又
    的頭像 發表于 01-13 10:00 ?764次閱讀

    基于移動自回歸的時序擴散預測模型

    回歸取得了比傳統基于噪聲的擴散模型更好的生成效果,并且獲得了人工智能頂級會議 NeurIPS 2024 的 best paper。 然而在時間序列預測領域,當前主流的擴散方法還是傳統的
    的頭像 發表于 01-03 14:05 ?681次閱讀
    基于移動自回歸的時序<b class='flag-5'>擴散</b>預測<b class='flag-5'>模型</b>

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3
    的頭像 發表于 01-03 10:38 ?819次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質量圖像

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出視頻生成模型Sora的應用程序接口(API)的計劃。Sora模型能夠基于文本和圖像生成
    的頭像 發表于 12-20 14:23 ?486次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創新之作——AI視頻生成模型Sora。這新品的發布,無疑為AI技術注入了新的活力。 據悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發表于 12-12 09:40 ?639次閱讀

    浙大、微信提出精確反演采樣器新范式,徹底解決擴散模型反演問題

    隨著擴散生成模型的發展,人工智能步入了屬于?AIGC?的新紀元。擴散生成模型可以對初始高斯噪聲進
    的頭像 發表于 11-27 09:21 ?604次閱讀
    浙大、微信提出精確反演采樣器新范式,徹底解決<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>反演問題

    字節跳動自研視頻生成模型Seaweed開放

    近日,字節跳動旗下的AI內容平臺即夢AI傳來新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺用戶開放使用。這舉措標志著字節跳動在AI視頻領域邁出了堅實的
    的頭像 發表于 11-11 14:31 ?586次閱讀

    擴散模型的理論基礎

    擴散模型的迅速崛起是過去幾年機器學習領域最大的發展之。在這本簡單易懂的指南中,學習你需要知道的關于擴散模型
    的頭像 發表于 10-28 09:30 ?1265次閱讀
    <b class='flag-5'>擴散</b><b class='flag-5'>模型</b>的理論基礎

    今日看點丨Vishay裁員800人,關閉上海等三家工廠;字節跳動發布兩款視頻生成模型

    企業市場開啟邀測。 ? 火山引擎介紹,豆包視頻生成模型基于DiT架構,通過高效的DiT融合計算單元,更充分地壓縮編碼視頻與文本,讓視頻在大
    發表于 09-25 15:48 ?915次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這舉措標志著火山引擎在視頻內容
    的頭像 發表于 09-25 14:11 ?561次閱讀

    bootloader在線生成的壓縮包內為空文件夾怎么解決?

    在線生成bootloader,同樣的Bootloader配置,成功生成一次,再次生成之后文件夾內為空,壓縮包172B,試了很多次都
    發表于 07-18 07:32

    MediaTek聯合快手推出高效端側視頻生成技術

    MediaTek 與快手共同宣布,推出高效端側視頻生成技術,共同探索并推進生成式 AI 技術的革新。作為對 2024 世界移動通信大會(MWC 2024)上亮相的視頻生成技術的延續,該
    的頭像 發表于 07-05 11:23 ?9659次閱讀

    Runway發布Gen-3 Alpha視頻生成模型

    專為電影和圖像內容創作者提供生成式AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻生成模型已經正式問世。這款模型在多方面均取得了顯著的進步,為創作者們帶來了前所未
    的頭像 發表于 06-19 09:25 ?812次閱讀