女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Sora之后,視頻生成模型的中國牌局

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-12-12 09:23 ? 次閱讀

wKgZO2dZq3uAABdRAAeFnl_r3bw480.jpg

Sora,自2月16日OpenAI發布后一直被吐槽是“技術期貨”,終于在12月10日,正式版Sora露面了,可以生成最高 1080p 分辨率、最長 20 秒的視頻

wKgZPGdZq3yAI5W2AAM40FlGZ88511.jpg

OpenAI CEO奧特曼稱,Sora正式版是視頻生成領域的GPT-1時刻。

但國內AI企業,并沒有像跟進GPT時期一樣,在視頻生成領域也與OpenAI保持同步,而是呈現出更復雜的態度。

有人選擇跟進,比如Sora問世之后,互聯網公司如阿里、字節跳動、快手、騰訊等,AI公司如智譜AI、MiniMax、愛詩科技、生數科技等,都陸續發布了視頻生成模型,不少都表示達到或超越了預覽版Sora。

也有人選擇不跟進,包括互聯網公司中的百度,李彥宏曾明確表示,“無論Sora多么火爆百度都不去做”。AI公司如百川智能,也明確表示不會做類Sora模型,月之暗面、商湯科技、零一萬物雖然都有文生視頻模型,但都不作為重點。

視頻生成賽道,不再延續GPT時代的發展模式,即OpenAI打出一張王牌,國內科技企業搶著要跟。Sora之后,國內AI牌局開始有了自己的節奏,也呈現出更為復雜的局勢。

有能力做通用基礎大模型的國內科技公司,在技術路線、商業前景等判斷上,開始出現明顯分野。我們就從國內企業跟進Sora的選擇與否,聊聊視頻生成的中國牌局。

wKgZO2dZq3yAUJLRAAG0zyA1AVA160.jpg

首先我們要明確一下,國內對標Sora模型的科技公司,到底在做什么?

簡單來說,Sora視頻生成模型的核心技術路線是Diffusion+Transformer相結合,通過文本(自然語言)、圖片、視頻作為提示詞prompts進行視頻生成。

對標Sora的模型,至少要具備幾個特點:

1.通用性,不針對某一類風格、行業、角色等,任意內容的視頻都可以生成。

2.高質量,畫質精度高(達到1080p)、視頻時間長(最長達一分鐘)、畫面一致性強(理解物理規律)。

面對Sora,國內科技企業不像ChatGPT推出時那樣毫無準備。但到底跟or不跟,卻不再像ChatGPT那樣高度一致,而是分化成了三類:

第一類,明確跟進。

互聯網公司陣營中,以視頻為核心業務的字節跳動、快手等,以及綜合科技公司騰訊,數字基建成熟,技術人才資源充沛,內部有視頻產品基因,幾乎第一時間選擇了跟進。字節跳動推出了即夢Dreamnia,快手也發布了可靈大模型。騰訊以混元大模型作為核心,發布并開源了混元多模態生成模型,被認為是騰訊版Sora。

wKgZO2dZq32AGgW6AAMBu39pjss846.jpg

大模型初創企業中,智譜AI的行動最為敏捷,今年7月發布了AI視頻生成工具清影,支持用戶通過文本/圖片,生成10秒、4K、60幀視頻。MiniMax的海螺AI也在十月增加了視頻生成能力,支持文本提示詞生成6秒視頻片段。

第二類,堅決不跟。

與第一類企業的態度截然相反,互聯網公司和大模型創企中也有堅決不跟Sora的。比如Sora問世之后,百川智能的王小川就表示,團隊有人提出要做Sora,但他明確表態稱不會跟進這個方向。

同樣想法的還有百度李彥宏,盡管百度已經在視頻生成領域取得了一定的成果,但他不做Sora的態度也非常堅決,原因是Sora的商業化可能要五年甚至十年,目前百度更聚焦在大語言模型、多模態大模型,沒有類Sora的產品化嘗試。

第三類,淺嘗輒止。

除此之外,還有大量國內企業對于Sora,出于FOMO“恐懼錯過”心理有所布局,但并不重點投入,處于一種淺嘗輒止的狀態。

比如阿里系中的阿里媽媽團隊發布了tomoVideo,試水電商營銷的視頻生成場景;“大模型六小虎”中,月之暗面也推出了視頻生成模型,但仍聚焦在kimi產品上;零一萬物入局B端業務,而視頻生成模型面向的影視制作行業正處于調整期,類Sora產品也很難成為核心增長點。

總結一下,如果說全球大模型是一場“斗地主”,那么游戲規則不再是OpenAI打出一張王炸,國內科技公司紛紛跟上,而是各自按照自己手里的牌面、業務重要性和優先級,來確定Sora的出牌策略。

為什么到了Sora,大模型行業的游戲規則就變了?

wKgZPGdZq36ADSo2AAG9K0tAYY8620.jpg

國內科技企業的表現說明,對于Sora存在非共識,整體還是比較混亂、規則模糊的階段。迷霧中的領域,游戲規則自然只能自行探索。

如今視頻生成領域的現狀,籠罩著三重迷霧。

技術迷霧:OpenAl認為Sora是世界模擬器、通往AGl的一條有前途的途徑,這一技術路線目前存在不少爭議。

比如李飛飛、lecun等人認為,Sora不能實現AGI。李飛飛提出,Sora仍是二維圖像,只有三維空間智能才能實現AGI。Sora預覽版展示的“日本女性走過霓虹閃爍東京街頭”的生成視頻,就無法把攝像機放在女子背后,說明Sora并沒有真的理解三維世界。學術大神Lecun也點名不看好Sora,說它根本不是真正的世界模型,并且仍會面臨GPT4的巨大瓶頸。

確實,即使是正式版Sora,生成的手部細節不準確,動態過程中的一致性等問題,依然存在。

而國內公司堅定不跟進Sora的原因之一,也是對這一技術路線保留意見。比如百川智能的王小川就認為,Sora只是階段性產物,技術高度、突破性以及應用價值均不及GPT。總之,實現AGI、模擬物理世界的技術路線的開放性,決定了Sora并非唯一解。

商業迷霧:視頻生成模型的商用前景、投資回報比,在短期內都不明朗,成為勸退國內企業的另一重阻礙。

預覽版和正式版Sora,都延續了OpenAI的“暴力美學”,OpenAI 研究科學家 Noam Brown 表示,Sora是scale力量最直觀的展示,也就是通過堆算力、對數據、對參數量的方式,來嘗試讓大模型涌現出理解物理世界的能力。這種方法成本高、資源投入大。是否跟進Sora,就取決于各家對模型的商用預期和投資回報比。

如果視頻生成模型面向ToB收費,通過API或SaaS服務,都需要基礎模型廠商投入大量人力去優化業務流程、開發交互頁面,而影視行業正處于調整周期,AI影視制作業務的增長有限。這就在無形中增加了AI企業的機會成本,因為同樣的人力、物力、算力,投入到金融AI、教育AI、大型政企等領域,顯然收效更大。所以,百度、零一萬物等公司,都將視頻生成領域作為邊緣業務,并不重點投入。

而ToC場景中,一方面個人付費意愿不高,視頻生成并不是大眾日常使用的高頻場景,而且生成成本和訂閱費一般都比文本模型高,加上Sora模型都沒能解決幻覺、一致性難題,未必能創造實際價值,所以C端付費規模十分有限。另一方面,模型完全免費,把視頻生成模型產品作為企業的流量入口,這一商業模式只適合將視頻作為核心業務的企業。

比如快手、字節跳動,本身就有核心的視頻業務,可以快速實現模型的規模化。面向C端用戶或B端生產力工具,這類企業能夠快速將視頻生成能力與現有產品進行集成與整合,模型研發的邊際成本是會隨著規模商用而下降的。

整體來看,對國內絕大多數基礎模廠,視頻生成領域都是一個相對邊緣、投資回報比不高的業務。

第三重迷霧,就是市場格局的競爭迷霧。

雖然視頻生成模型現在商業前景不明,但有沒有可能以后會爆發,企業悄悄投入然后驚艷所有人?這種押注邊緣賽道“撿大漏”的商業神話,在大模型身上恐怕很難發生。

當前,大模型的產品化、商業化前景普遍比較模糊,通用模型廠商都需要盡快從一大堆不甚明朗的產品中,選出一個更高成功概率和更大市場潛力的選項,重點投入。而在所有產品中,視頻生成模型是一個尤為沉重且具有挑戰性的項目。這種情況下,肯定要優先考慮成功率更高的產品,降低視頻生成模型的業務優先級。

換一個角度,即便企業將視頻生成模型的優先級放到最高,恐怕也很難建立起競爭優勢。因為當前大模型的市場競爭情況跟GPT時期不太一樣,如今各家在基礎訓練設施、核心架構設計與技術儲備等方面都有了一定積累,復現Sora并上線類Sora應用的技術壁壘,其實沒有ChatGPT時期那么難了。這也意味著,即使企業先發布了視頻生成模型,也未必能長期保持競爭優勢和市場壟斷地位,這種競爭態勢也削弱了Sora的商業想象空間。

技術迷霧、商業迷霧、競爭迷霧,仍然籠罩在視頻生成領域,導致Sora這一場牌局有著太多的不確定,和太多可能。哪種理解是對的,哪條路線是最終贏家,目前都言之過早,各家只能按照自己的游戲規則玩下去。

wKgZO2dZq4GAb8SYAAGsitZg7cQ964.jpg

大模型技術必須繼續發展下去,但從Sora開始,國內科技企業不再緊跟著OpenAI亦步亦趨,開始有了自己的節奏感。

具體表現在,對于Sora這樣一鳴驚人的新東西,國內企業在大模型產品化、商業化上都有了自己的理解與思考,開始自己定義玩法,跟進Sora展現的是實力,不跟進Sora展現的是心態與戰略定力。

此外,不一味跟進產品,但OpenAI的敘事能力仍然值得學習。

wKgZPGdZq4GAWF7MAAM_RyY40wg203.jpg

無論是2月用Sora搶走谷歌風頭,還是近期Sora正式上線,OpenAI總能一次次帶動節奏、設置議題、吸引關注,這對于資本密集型AI企業是非常重要的能力。

可以不跟進Sora,但不能遺漏關鍵技術。

以百度為例,雖然沒有推出Sora產品的計劃,但自身也沒有缺席關鍵技術,比如自研了多模態可控生圖技術,能夠在保持實體特征不變的情況下,實現圖像的高泛化生成,而可控性的提升,恰恰是視頻生成下一階段核心中的核心。此外,百度也沒有完全無視視頻生成領域,目前投資了視頻生成初創公司生數科技、AI視頻短劇公司井英科技等。

聚焦主賽道,以自身核心業務、商業優先級等多元因素來確定追趕Sora的輕重緩急。大模型的牌局,國內企業正在找到自己的節奏感。

wKgZPGdZq4KATSv4AAGy_4FMs5s928.jpg

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34182

    瀏覽量

    275341
  • Sora
    +關注

    關注

    0

    文章

    83

    瀏覽量

    424
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    字節跳動即將推出多模態視頻生成模型OmniHuman

    字節跳動旗下一站式AI創作平臺即夢AI即將迎來重大更新,全新多模態視頻生成模型OmniHuman即將上線。這款模型是字節跳動自研的閉源模型,其強大的功能令人矚目:僅需一張圖片與一段音頻
    的頭像 發表于 02-08 10:53 ?647次閱讀

    阿里云通義萬相2.1視頻生成模型震撼發布

    近日,阿里云旗下的通義萬相迎來了重要升級,正式推出了全新的萬相2.1視頻生成模型。這一創新成果標志著阿里云在視頻生成技術領域的又一次重大突破。 據悉,萬相2.1視頻生成
    的頭像 發表于 01-13 10:00 ?743次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應用程序接口(API)的計劃。Sora模型能夠基于文本和圖像
    的頭像 發表于 12-20 14:23 ?470次閱讀

    中國電信發布自研視頻生成模型

    中國電信隆重發布了首個由央企全自研的視頻生成模型。該模型采用了創新的“VAST(Video As Storyboard from Text)二階段
    的頭像 發表于 12-13 15:40 ?476次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創新之作——AI視頻生成模型Sora。這一新品的發布,無疑為AI技術注入了新的活力。 據悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發表于 12-12 09:40 ?618次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預覽以來,Sora歷經約10個月的精心研發與優化,現已全面
    的頭像 發表于 12-10 11:16 ?666次閱讀

    字節跳動自研視頻生成模型Seaweed開放

    近日,字節跳動旗下的AI內容平臺即夢AI傳來新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺用戶開放使用。這一舉措標志著字節跳動在AI視頻領域邁出了堅實的一步。
    的頭像 發表于 11-11 14:31 ?572次閱讀

    今日看點丨Vishay裁員800人,關閉上海等三家工廠;字節跳動發布兩款視頻生成模型

    1. 字節跳動發布兩款視頻生成模型 面向企業市場開啟邀測 ? 9月24日,字節跳動旗下火山引擎發布兩款視頻生成模型(豆包視頻生成-Pix
    發表于 09-25 15:48 ?907次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標志著火山引擎在視頻內容生成領域邁出了重要一步。豆包
    的頭像 發表于 09-25 14:11 ?542次閱讀

    阿里通義將發布視頻生成模型

    在即將召開的云棲大會上,阿里通義將震撼發布其自主研發的視頻生成模型。目前,用戶已可通過通義App頻道及通義萬相PC端預約體驗這一創新功能,盡管具體使用尚未開放。
    的頭像 發表于 09-19 17:01 ?554次閱讀

    MediaTek與快手攜手創新,端側視頻生成技術引領AI新紀元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項重大技術突破——高效端側視頻生成技術的誕生。這項技術不僅是對即將于2024年世界移動通信大會(MWC 2024)上亮相的先進視頻生成技術的有力延續,更是雙方在生成
    的頭像 發表于 07-05 11:52 ?1604次閱讀

    MediaTek聯合快手推出高效端側視頻生成技術

    MediaTek 與快手共同宣布,推出高效端側視頻生成技術,共同探索并推進生成式 AI 技術的革新。作為對 2024 世界移動通信大會(MWC 2024)上亮相的視頻生成技術的延續,該技術結合快手
    的頭像 發表于 07-05 11:23 ?9177次閱讀

    商湯發布首個“可控”人物視頻生成模型Vimi

    近日,商湯科技在人工智能領域再次取得重大突破,正式發布了其首個面向消費者的“可控”人物視頻生成模型——Vimi。這一創新技術的問世,標志著視頻內容創作進入了一個全新的互動與個性化時代。
    的頭像 發表于 07-04 15:29 ?955次閱讀

    Runway發布Gen-3 Alpha視頻生成模型

    專為電影和圖像內容創作者提供生成式AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻生成模型已經正式問世。這款模型在多方面均取得了顯著的進步,為創作者們帶來了前所未
    的頭像 發表于 06-19 09:25 ?800次閱讀

    Sora還在PPT階段,“中國Sora”已經開放使用了!

    電子發燒友網報道(文/梁浩斌)今年春節期間,OpenAI的AI文字生成視頻模型Sora驚艷全世界,極高的視頻生成效果、長達60秒的
    的頭像 發表于 06-17 09:07 ?4017次閱讀