搶先體驗 AI 微服務(wù)在云端提供的優(yōu)質(zhì)通信。
新版NVIDIA Maxine為實時音頻和視頻通信鋪平了道路。無論是參加視頻會議、致電客戶服務(wù)中心,還是進(jìn)行直播,Maxine 都能夠助您實現(xiàn)清晰明確的溝通,增強(qiáng)虛擬交互的效果。
NVIDIA Maxine 是一套由 GPU 加速的 AI 軟件開發(fā)套件 (SDK) 和云原生微服務(wù),用于部署經(jīng)過優(yōu)化和加速的 AI 功能,可達(dá)到實時增強(qiáng)音頻、視頻和增強(qiáng)現(xiàn)實 (AR) 效果的目的。
借助 Maxine 的先進(jìn)模型,最終用戶無需使用昂貴的設(shè)備即可改進(jìn)音頻和視頻質(zhì)量。基于 NVIDIA AI 的技術(shù)使標(biāo)準(zhǔn)的麥克風(fēng)和攝像頭設(shè)備也能夠達(dá)到這些高質(zhì)量的效果。
在 GTC 上,NVIDIA 宣布為云原生微服務(wù)重新構(gòu)建 Maxine,并推出了 Maxine 音頻效果微服務(wù)的搶先體驗版。此外,還推出了新的 Maxine SDK 功能,包括發(fā)言者聚焦和人臉表情估計,并正式推出了眼神交流功能。NVIDIA Maxine 現(xiàn)在還包含現(xiàn)有 SDK 功能的增強(qiáng)版。
Maxine 實現(xiàn)云原生
Maxine 的云原生微服務(wù)允許開發(fā)者構(gòu)建實時 AI 應(yīng)用。微服務(wù)可以獨立管理,并在云端進(jìn)行無縫部署,從而縮短開發(fā)周期。
搶先體驗版的 Audio Effects 微服務(wù)中包含四種先進(jìn)的音頻功能:
背景噪音消除:使用 AI 模型消除多種常見的背景噪音,同時保留說話者的自然聲音。
房間回聲消除:使用 AI 模型消除音頻中的混響,恢復(fù)說話者聲音的清晰度。
音頻超高分辨率:提高音頻信號的時間分辨率,改善音頻質(zhì)量。該功能目前支持 8 kHz 到 16 kHz 以及 16 kHz 到 48 kHz 的上采樣。
聲學(xué)回聲消除:消除輸入音頻流中的實時聲學(xué)設(shè)備回聲,從而去除不匹配的聲對和雙聲。借助基于 AI 的技術(shù),Maxine 實現(xiàn)了比傳統(tǒng)數(shù)字信號處理算法更有效的回聲消除。
Pexip 是一家領(lǐng)先的企業(yè)視頻會議和協(xié)作解決方案提供商,正在利用 NVIDIA 的 AI 技術(shù)將虛擬會議提升到更高水平,為現(xiàn)代員工隊伍提供先進(jìn)的功能。
Pexip 戰(zhàn)略聯(lián)盟高級副總裁 Eddie Clifton 表示:“隨著 Maxine 向云原生微服務(wù)的轉(zhuǎn)化,我們能夠更加輕松地將 NVIDIA 的先進(jìn) AI 技術(shù)與我們獨特的服務(wù)器端架構(gòu)結(jié)合起來。這使我們的 Pexip 團(tuán)隊能夠為虛擬會議提供更強(qiáng)的體驗。”
探索 SDK 的增強(qiáng)功能
Maxine 提供了三款由 GPU 加速的 SDK,能夠通過 AI 重塑實時通信的音頻、視頻和 AR 效果。
音頻效果 SDK 可提供多效果、低延遲,以及基于 AI 的音頻質(zhì)量增強(qiáng)算法。發(fā)言者聚焦是搶先體驗版中的新功能,該功能能夠分離前景和背景發(fā)言者的音軌,使聽眾能夠更加輕松地識別每種聲音。此外,還更新了音頻超高分辨率SDK 功能,使其具備更高的質(zhì)量。
視頻效果 SDK 會使用標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭輸入創(chuàng)建基于 AI 的視頻效果。虛擬背景功能已獲得更新,增強(qiáng)了時間穩(wěn)定性,該功能能夠分割個人形象并應(yīng)用由 AI 驅(qū)動的背景去除、替換或模糊功能。
AR SDK 基于標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭饋送,提供基于 AI 的實時 3D 面部追蹤和身體姿態(tài)估計。新功能包括:
眼神交流:通過預(yù)估和將視線與攝像頭對齊來模擬眼神交流。
人臉表情估計:追蹤人臉并推斷主體所呈現(xiàn)的表情。
更新了以下 AR 功能:
身體姿態(tài)估計:以 2D 和 3D 形式預(yù)測和追蹤人體的 34 個關(guān)鍵點,并且現(xiàn)已支持多人追蹤。
面部特征點追蹤:使用 126 個關(guān)鍵點來識別面部特征和輪廓。現(xiàn)已可使用“畫質(zhì)”模式來追蹤由于頭部運動和表情造成的頭部姿勢和面部變形(實時追蹤的自由度為 3 度),實現(xiàn)了更高質(zhì)量的跟蹤效果。
人臉網(wǎng)格:以高達(dá) 3000 個頂點和 6 個自由度的 3D 網(wǎng)格表示人臉,并且現(xiàn)在包括USC 創(chuàng)意技術(shù)研究所的 3D 可變形模型。
直接體驗 Maxine 的驚艷效果。
體驗由 AI 的強(qiáng)大功能帶來的先進(jìn)效果
Maxine SDK 和微服務(wù)可為您提供一套低延遲的 AI 效果,且可與現(xiàn)有的客戶基礎(chǔ)設(shè)施進(jìn)行集成。由于 Maxine 的尖端 AI 功能的構(gòu)建以 NVIDIA AI 平臺為基礎(chǔ),并且擁有領(lǐng)先的預(yù)訓(xùn)練模型,所以開發(fā)者用戶可利用其來創(chuàng)建、定制和部署優(yōu)質(zhì)的音頻和視頻質(zhì)量功能。
Maxine 也是NVIDIA Omniverse Avatar Cloud Engine的一部分,NVIDIA Omniverse Avatar Cloud Engine 是一系列基于云的 AI 模型和服務(wù),可供開發(fā)者構(gòu)建、定制和部署交互式虛擬形象。Maxine 的可定制云原生微服務(wù)允許您在 AI 效果制作流程中進(jìn)行獨立部署。而且,您可以在本地、云端或邊緣部署 Maxine。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5227瀏覽量
105682 -
AI
+關(guān)注
關(guān)注
87文章
34000瀏覽量
275090 -
云原生
+關(guān)注
關(guān)注
0文章
256瀏覽量
8195
原文標(biāo)題:GTC22 | 全新 NVIDIA Maxine 云原生架構(gòu)可大規(guī)模實現(xiàn)突破性影音質(zhì)量
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
羅德與施瓦茨和高通合作加速下一代無線通信發(fā)展
哈佛新技術(shù)為先進(jìn)機(jī)器視覺鋪平道路

NVIDIA技術(shù)助力Pantheon Lab數(shù)字人實時交互解決方案
聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個人AI超級計算機(jī)設(shè)計NVIDIA GB10超級芯片
蘋果預(yù)訂M5芯片,預(yù)計2025年底投產(chǎn)
想通過手機(jī)音頻口實現(xiàn)與MCU的實時通信,有沒有體積較小,開發(fā)起來難度較小的音頻解碼芯片?
NVIDIA Parabricks v4.3.1版本的新功能

IB Verbs和NVIDIA DOCA GPUNetIO性能測試

英偉達(dá)發(fā)布新版NVIDIAApp
可以使用esp8266處理實時視頻和音頻流到服務(wù)器到移動設(shè)備?
【新品】隔離型一轉(zhuǎn)多路RS485中繼器,高速傳輸,穩(wěn)定通信必備

NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持
NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

評論