女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布VLOGGER AI模型,實現(xiàn)肖像朗讀音頻內(nèi)容

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 14:27 ? 次閱讀

3 月 19 日,Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容,使人物生動地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來說,VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進行訓(xùn)練,涵蓋了超80萬個人物肖像及超過2200小時的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團隊指出,相較于之前的同類產(chǎn)品,VLOGGER 的獨特之處在于無需針對每個使用者進行單獨培訓(xùn),且不受限于人臉檢測和裁剪,能產(chǎn)出完整的圖像,且能夠處理更多元化的情境如可見的身軀或者其他身份特征,這對于真實再現(xiàn)人物交流過程至關(guān)重要。

谷歌將 VLOGGER 視為通往“通用聊天機器人”未來的關(guān)鍵一步,使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報告、教育領(lǐng)域以及旁白等方面的輔助工具,并能對已有的電影進行剪輯和表情調(diào)整。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1787

    瀏覽量

    58684
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3488

    瀏覽量

    50008
  • VLogger
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8404
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強大的端側(cè)運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)圈,實現(xiàn)TAO
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    與推理 AI 模型谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動式” 的范式轉(zhuǎn)變,未來 AI 代理將能夠主動檢索并
    的頭像 發(fā)表于 04-12 00:57 ?2101次閱讀

    谷歌“減法”新動作:砍掉耳機按鍵喚醒朗讀功能

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)近期,谷歌宣布將對耳機上的 Google Assistant語音助手功能進行調(diào)整,取消通過觸控喚醒助理“自動朗讀未讀通知”的功能。谷歌表示,要想完成該功能可以通過語音
    的頭像 發(fā)表于 02-22 22:56 ?2329次閱讀
    <b class='flag-5'>谷歌</b>“減法”新動作:砍掉耳機按鍵喚醒<b class='flag-5'>朗讀</b>功能

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開發(fā)提供強大助力。
    的頭像 發(fā)表于 01-08 11:01 ?487次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創(chuàng)意的提示,然后使用 Imagen 3
    的頭像 發(fā)表于 01-03 10:38 ?814次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布了一款名為“深度研究”的先進AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型實現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與
    的頭像 發(fā)表于 12-16 09:35 ?625次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和
    的頭像 發(fā)表于 12-12 14:22 ?750次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?586次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1054次閱讀

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)標注屏幕朗讀內(nèi)容的場景

    控件包含顯示文本(text)、無障礙文本(accessibilityText)2個屬性,其中,顯示文本為用戶界面上呈現(xiàn)的信息,無障礙文本為無障礙專有的朗讀信息,不在界面上顯示。屏幕朗讀提取信息進行
    發(fā)表于 10-12 15:52

    谷歌Pixel 9系列發(fā)布會:AI技術(shù)領(lǐng)先,Gemini AI成焦點

    8月14日,谷歌在景山城總部舉行了一場備受矚目的新品發(fā)布會,提前于蘋果iPhone 16系列發(fā)布,展示了Pixel 9系列手機及其搭載的全新AI功能,這一舉措迅速吸引了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 08-15 15:22 ?1518次閱讀

    谷歌獲Character.AI模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達成了一項重要合作,非獨家授權(quán)谷歌使用其先進的大型語言模型技術(shù)。此次合
    的頭像 發(fā)表于 08-05 14:35 ?683次閱讀

    蘋果AI模型訓(xùn)練新動向:攜手谷歌,未選英偉達

    近日,蘋果公司發(fā)布的最新研究報告揭示了其在人工智能領(lǐng)域的又一重要戰(zhàn)略選擇——采用谷歌設(shè)計的芯片來訓(xùn)練其AI模型,而非行業(yè)巨頭英偉達的產(chǎn)品。這一決定在業(yè)界引起了廣泛關(guān)注,尤其是在當(dāng)前英偉
    的頭像 發(fā)表于 08-01 18:11 ?1082次閱讀

    谷歌發(fā)布革命性AI天氣預(yù)測模型NeuralGCM

    在科技與自然科學(xué)的交匯點上,谷歌公司于7月23日宣布了一項重大突破——全新的人工智能天氣預(yù)測模型NeuralGCM。這一創(chuàng)新成果不僅融合了機器學(xué)習(xí)的前沿技術(shù),還巧妙結(jié)合了傳統(tǒng)氣象學(xué)的精髓,其研究成果已在國際權(quán)威科學(xué)期刊《Nature》上
    的頭像 發(fā)表于 07-23 14:24 ?752次閱讀

    谷歌發(fā)布新型大語言模型Gemma 2

    在人工智能領(lǐng)域,大語言模型一直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言模型——Gemma 2。這款
    的頭像 發(fā)表于 06-29 09:48 ?674次閱讀