4 月 19 日報道,近期微軟亞洲研究院推出了名為 VASA-1 的創新模型,針對靜態肖像照片和錄音音頻片段,其能實現圖片中角色的自動化配音。
該模型,尤其擅長展現逼真的面部表情及各類情緒,且嘴唇動作高度擬真。然而,盡管研究員坦承目前仍有不足之處,如無法精準處理頭發等纖維質元素,但相較于其他類似模型,VASA-1 的表現已屬優異。
此外,研究員還透露,VASA-1 在離線批量處理模式下,可生成分辨率高達 512*512 的動態短片,幀速率為 45fps;在線直播模式下,幀速率也可達到 40fps,延遲時間僅為 170ms。而完成這一切,只需一臺搭載 NVIDIA RTX 4090 顯卡的計算機即可。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6668瀏覽量
105360 -
模型
+關注
關注
1文章
3483瀏覽量
49968 -
Vasa
+關注
關注
0文章
2瀏覽量
6618
發布評論請先 登錄
相關推薦
熱點推薦
安徽省水利科學研究院攜手中科曙光完成DeepSeek大模型部署
近日,安徽省(水利部淮河水利委員會)水利科學研究院攜手中科曙光,成功完成國產大模型DeepSeek、BGE-M3嵌入模型及重排模型的本地化部署與測試,并順利接入梅山水庫運行管理矩陣平臺
鯤云科技與中國工業互聯網研究院成立AI+安全生產聯合實驗室
在 2025 年 1 月 14 日舉行的智算創新研究院開業盛典上,鯤云科技與中國工業互聯網研究院(以下簡稱“工聯院”)正式宣布聯合成立“AI+安全生產聯合實驗室”,工聯
榮譽+1!利爾達物聯網技術有限公司獲“浙江省企業研究院”認定
研究院”。浙江省企業研究院是浙江省為全面深入實施創新驅動發展戰略,構建和完善浙江省技術創新中心體系的重要組成部分。它是設在企業內部相對獨立的具有較高層次和水平的省級

浪潮信息與智源研究院攜手共建大模型多元算力生態
近日,浪潮信息與北京智源人工智能研究院正式簽署戰略合作協議,雙方將緊密合作,共同構建大模型多元算力開源創新生態。 此次合作旨在提升大模型創新研發的算力效率,降低大模型應用開發的算力門檻
安謀科技與智源研究院達成戰略合作,共建開源AI“芯”生態
12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智源人工智能研究院(以下簡稱“智源研究院”)正式簽署戰略合作協議,雙方將面向多元AI芯片領域開展算子庫優化與適配、編譯器與工具鏈
發表于 12-26 17:06
?376次閱讀

浪潮信息與智源研究院達成戰略合作協議
近日,浪潮信息與智源研究院達成戰略合作協議,雙方將緊密協作共建大模型多元算力開源創新生態,提升大模型創新研發的算力效率,降低大模型應用開發的算力門檻。目前,智源Triton算子庫Fla
清新電源研究院榮獲深圳市5A級社會組織
12月18日,2024年度市級社會組織等級評估授牌儀式在深圳市福田區深科技城順利舉行。深圳市清新電源研究院作為2024年度深圳市5A級社會組織接受授牌。深圳市清新電源研究院黨支部書記、副院長楊洪青

天馬與武進南大未來技術創新研究院達成戰略合作
近日,天馬新型顯示技術研究院(廈門)有限公司、上海天馬微電子有限公司與武進南大未來技術創新研究院就Micro LED業務、非顯傳感業務達成戰略合作。
陳天橋雒芊芊腦科學研究院在人工智能領域取得重大突破
及AutoGPT共同發起的GAIA(通用人工智能助手)基準測試中榮登榜首。這一壯舉超越了包括微軟研究院在內的眾多國際頂尖機構的框架,彰顯了TCCI的卓越實力。
藍思科技將新增昆山創新研究院,重點服務蘋果
藍思科技近日宣布,將新增一個重點研發機構,即藍思昆山創新研究院,目前正在緊鑼密鼓地建設中。該研究院的成立,標志著藍思科技在研發領域的進一步拓展和深化。
中國電信人工智能研究院完成首個全國產化萬卡萬參大模型訓練
近日,中國電信人工智能研究院宣布了一項重大技術突破:成功完成國內首個基于全國產化萬卡集群訓練的萬億參數大模型。
摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配
近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統一系統計算架構MUSA,雙方在短短一周多的時間
中國電信發布全球首個單體稠密萬億參數語義模型
近日,中國電信人工智能研究院(TeleAI)攜手北京智源人工智能研究院,共同推出了全球首個單體稠密萬億參數語義模型——Tele-FLM-1T,這一里程碑式的成就標志著中國電信在人工智能
評論