電子發燒友網報道(文/周凱揚)在大型數據中心里,視頻處理或許是當下占比最高的關鍵工作負載,疫情期間,人們在視頻細分的產品上所花時間越來越多。對于云服務廠商來說,視頻市場帶來的紅利仍然在持續,但對于視頻網站和視頻app等產品來說,他們面臨的服務器成本壓力也在與日俱增。
?
云平臺的視頻轉碼單價/ 華為云
比如隨著流量激增,Teams、Zoom和騰訊會議等服務都出現了崩潰的事故,有的視頻網站面臨巨額的服務器費用和下跌的營收,也開始采取壓縮畫質等策略。盡管服務器端的摩爾定律依然在延續,但面對視頻處理的計算需求,已經開始有些力不從心了,哪怕在專業處理圖形的GPU加持下也是如此。如果不采用特定領域的ASIC硬件加速器,成本壓力將會繼續堆積。
全球最大視頻網站的策略
作為全球最大視頻網站Youtube的所有者,照理說谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩定的狀態,而且視頻質量也是同行中最高的那一檔。能維持住這樣服務器壓力,靠的并不是傳統的CPU+GPU商用服務器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預見了真正大規模視頻處理和其他消費級服務器用例的根本差異,尤其是在數據多樣性、質量要求、吞吐量和成本上。所以谷歌打算從計算資源最昂貴的一塊,也就是視頻處理這塊著手,設計自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲、直播到云游戲等一眾業務上的視頻處理難題。
VCU的設計思路
谷歌的VCU全名為視頻編碼單元,單個芯片集成了10個編碼核心、3個解碼核心。從谷歌VCU芯片的布圖規劃也可以看出,大部分區域都分配給了編碼器核心,其次是四通道的LPDDR4內存,不僅提供邊帶錯誤糾正,也提供芯片所需的帶寬。
?
VCU芯片布圖規劃/ 谷歌
每個VCU服務器系統由10塊板卡組成,每塊板卡上配有2個VCU芯片。谷歌將一切非轉碼的處理工作丟給非VCU服務器,而VCU服務器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉碼所需時間。
但我們要知道一點,視頻處理專用的服務器成本之所以如此之高,并不是只有GPU價格高、性能要求高等原因,還有就是低利用率的問題。并非所有的轉碼工作都能用滿芯片的硬件資源,所以谷歌采用了固件管理的隊列來啟用并發轉碼。
?
VCU加速卡/ 谷歌
比如某個操作是“將這一幀的畫面編碼為VP9位流,”那么應用程序負責將指令寫入隊列中,固件則只負責隊列調度和編解碼器核心的激活。如此一來編程只發生在應用層面,避免了ASIC這類硬件先天缺乏FPGA那樣靈活的可編程性,也符合數據中心快節奏的軟件迭代速度,同時又確保了沒有一個編碼核心能閑下來。
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉碼或4個英偉達T4 GPU轉碼的對比,8個VCU的配置在進行H.264或VP9轉碼時,性價比最高可達前兩種方案的20倍以上。
專用視頻處理硬件的未來
對于流量快速增長,負載持續增加的大規模數據中心和云服務來說,谷歌這種方案無疑是最省成本的。阿里巴巴、亞馬遜等云服務廠商紛紛開始了自研服務器芯片計劃,這點人盡皆知,但從設計上就可以看出,這些芯片還是面向在通用服務器或AI服務器的,與視頻沾邊的應用也大部分是AI視頻識別類的。
而目前最讓視頻產品頭疼的轉碼這塊,卻少有ASIC產品的出現,不少加速卡做成了PCIe的尺寸規格,但其實仍是基于CPU,尤其是編解碼性能稍強的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優勢,但考慮到這些加速卡高昂的價格,目前云服務平臺還沒有普及開來,甚至還在用老版的UltraScaleFPGA。
與此同時,AV1這類壓縮率更高編碼的編碼標準提出了更高的硬件要求,谷歌的VCU雖然性價比極高,也沒有支持AV1這一標準,或許我們會在下一代VCU上看到。

云平臺的視頻轉碼單價/ 華為云
全球最大視頻網站的策略
作為全球最大視頻網站Youtube的所有者,照理說谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩定的狀態,而且視頻質量也是同行中最高的那一檔。能維持住這樣服務器壓力,靠的并不是傳統的CPU+GPU商用服務器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預見了真正大規模視頻處理和其他消費級服務器用例的根本差異,尤其是在數據多樣性、質量要求、吞吐量和成本上。所以谷歌打算從計算資源最昂貴的一塊,也就是視頻處理這塊著手,設計自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲、直播到云游戲等一眾業務上的視頻處理難題。
VCU的設計思路
谷歌的VCU全名為視頻編碼單元,單個芯片集成了10個編碼核心、3個解碼核心。從谷歌VCU芯片的布圖規劃也可以看出,大部分區域都分配給了編碼器核心,其次是四通道的LPDDR4內存,不僅提供邊帶錯誤糾正,也提供芯片所需的帶寬。

VCU芯片布圖規劃/ 谷歌
每個VCU服務器系統由10塊板卡組成,每塊板卡上配有2個VCU芯片。谷歌將一切非轉碼的處理工作丟給非VCU服務器,而VCU服務器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉碼所需時間。
但我們要知道一點,視頻處理專用的服務器成本之所以如此之高,并不是只有GPU價格高、性能要求高等原因,還有就是低利用率的問題。并非所有的轉碼工作都能用滿芯片的硬件資源,所以谷歌采用了固件管理的隊列來啟用并發轉碼。

VCU加速卡/ 谷歌
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉碼或4個英偉達T4 GPU轉碼的對比,8個VCU的配置在進行H.264或VP9轉碼時,性價比最高可達前兩種方案的20倍以上。
專用視頻處理硬件的未來
對于流量快速增長,負載持續增加的大規模數據中心和云服務來說,谷歌這種方案無疑是最省成本的。阿里巴巴、亞馬遜等云服務廠商紛紛開始了自研服務器芯片計劃,這點人盡皆知,但從設計上就可以看出,這些芯片還是面向在通用服務器或AI服務器的,與視頻沾邊的應用也大部分是AI視頻識別類的。
而目前最讓視頻產品頭疼的轉碼這塊,卻少有ASIC產品的出現,不少加速卡做成了PCIe的尺寸規格,但其實仍是基于CPU,尤其是編解碼性能稍強的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優勢,但考慮到這些加速卡高昂的價格,目前云服務平臺還沒有普及開來,甚至還在用老版的UltraScaleFPGA。
與此同時,AV1這類壓縮率更高編碼的編碼標準提出了更高的硬件要求,谷歌的VCU雖然性價比極高,也沒有支持AV1這一標準,或許我們會在下一代VCU上看到。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
谷歌
+關注
關注
27文章
6223瀏覽量
107520
發布評論請先 登錄
相關推薦
熱點推薦
STM32CubeMX在配置DCMI的腳位時,在Mode的選項中, 只有8bits, 10bits與12bits, 為何沒有14bits?
STM32CubeMX在配置DCMI的腳位時,在Mode的選項中, 只有8bits, 10bits與12bits, 為何沒有14bits?
發表于 04-27 08:49
畫質巔峰之作!海信電視U8N Pro斬獲“年度最佳畫質電視”大獎
近日,電視行業權威數碼評測媒體曉春哥XCG正式揭曉了2024年年度電視評選結果。在眾多電視型號中,“AI畫質專家”海信電視U8N Pro憑借其畫質芯片、MiniLED和屏幕的全新升級,打造了頂流
AMS-HE200:HDMI音視頻網絡延長器,重塑遠距離視聽傳輸新境界
在追求極致視聽體驗與高效傳輸的當下,HDMI音視頻網絡延長器AMS-HE200以其卓越的性能和廣泛的應用領域,正逐步成為市場上的明星產品。這款由深圳市程達科技有限公司傾力打造的延長器,不僅突破了傳統

ADS1191數據讀取,為何CH1始終為0x0030,只有CH2會產生變化?
通過串口采集的數據如下:
c000 3000
c000 3000
c000 3002
c000 3000
c000 3001
c000 3000
c000 3000
c000 3002
為何CH1始終為0x0030,只有CH2會產生變化,采集信號時應該是CH1和CH2同
發表于 12-11 08:24
AMS-HE200:HDMI音視頻網絡延長器,開啟傳輸新時代
傳輸領域的領軍企業,憑借其強大的技術實力和創新能力,推出了全新的AMS-HE200 HDMI音視頻網絡延長器,旨在為用戶帶來更加高效、穩定、便捷的傳輸體驗。 一、產品亮點? AMS-HE200作為一款高性能的HDMI音視頻網絡延長器,具備多種

4K視頻為何越來越糊?SGMII與HEVC如何重拾高碼流體驗
1.引言隨著網絡視頻平臺的發展,用戶對于4K高清畫質的需求日益增長。然而,許多用戶發現,即使購買了視頻平臺的會員,觀看4K內容時畫質卻不如預期,有時甚至還會出現模糊、卡頓的情況。這種現

戴爾科技助力企業實現科學的降本增效
降本增效作為一個老生常談的話題,盡管在多年的實踐中各種策略和方法層出不窮,但真正實現成本削減和效率提升的路徑依然不明確,一不小心就變成了“降本降效”。
如何以及為何要在EtherCAT?應用中使用DP83826
電子發燒友網站提供《如何以及為何要在EtherCAT?應用中使用DP83826.pdf》資料免費下載
發表于 08-27 10:19
?0次下載

新火種AI 大模型公司紛紛被收編!創始人們逐漸變成了“最討厭的自己”?
最近,國內大模型公司的融資潮正在如火如荼的進行著,各大公司紛紛收獲了融資,正在攜手邁進“200億估值”的門檻。 不過,與國內大模型領域的繁花似錦相比,國外的大模型公司卻是另外一番景象。在海外,諸如

Mini LED等于好畫質?買電視牢記這三點才能不踩坑!
”,以為分區越高的Mini LED電視,肯定畫質越好。其實,這是一種誤區,從專業角度而言,Mini LED只是背光燈的一種選型,分區數也只是關聯電視畫質的一個方面。 ??要判斷一臺Mini LED電視的畫質夠不夠“頂”,得從芯片
谷歌AI新突破:為無聲視頻智能配音
近日,谷歌DeepMind團隊公布了一項革命性的技術——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。這一技術的出現,不僅為視頻創作領域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗。
esp32-s2為何在menuconfig中找不到觸控板選項?
esp32-s2-kaluga-1 V1.3
idf4.4
touch_audio實例
為何在menuconfig中找不到觸控板選項?如果有也只有V1.2
發表于 06-19 07:23
評論