繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。 近日,谷歌發(fā)布了一種新的AI模型Genie,據(jù)谷歌官網(wǎng)介紹,Genie是一個基于互聯(lián)網(wǎng)視頻訓練的基礎世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可控的環(huán)境。
隨著谷歌的加入,世界模型領域的競爭愈發(fā)激烈,但目前尚難以確定誰能引領這一領域的發(fā)展風向。此前,Sora作為一款世界模型已引發(fā)爭議。反對者認為其視頻生成方式與世界模型的因果預測存在很大不同。從Sora發(fā)布的視頻來看,雖然保真度較高,但模擬物理規(guī)律似乎是其弱點,且目前難以看出其交互能力。
相比之下,谷歌的Genie在交互性方面下了不少功夫。它能夠推斷出生成環(huán)境中的潛在動作,為用戶提供一個可玩的、交互式的虛擬環(huán)境。然而,在視頻真實性和清晰度的層面,Genie尚未展現(xiàn)出與Sora相當?shù)乃健?/p>
總的來說,谷歌的Genie和Sora各自具有不同的優(yōu)勢和挑戰(zhàn)。世界模型領域正迎來一場激烈的競爭,未來的發(fā)展方向?qū)⑷Q于各大公司在技術創(chuàng)新和市場應用上的表現(xiàn)。我們期待看到這一領域能夠涌現(xiàn)出更多創(chuàng)新成果,推動人工智能技術的不斷發(fā)展和進步。
-
谷歌
+關注
關注
27文章
6231瀏覽量
108119 -
模型
+關注
關注
1文章
3519瀏覽量
50416 -
OpenAI
+關注
關注
9文章
1207瀏覽量
8909
發(fā)布評論請先 登錄
聲學世界模型將如何改變我們的生活
自動駕駛中常提的世界模型是個啥?

世界模型:多模態(tài)融合+因果推理,解鎖AI認知邊界
大模型領域常用名詞解釋(近100個)

NVIDIA Cosmos世界基礎模型平臺的主要功能

英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數(shù)據(jù)問題

華為、理想、特斯拉、商湯的世界模型是做什么用的

評論