作者:安謀科技 (Arm China) 高級軟件產品經理 楊喜樂
視頻編解碼技術作為支撐超高清視頻及泛音視頻產業發展的基石,其重要性愈發凸顯。H.264/AVC 是目前廣泛使用的編解碼標準,能夠在較低的數據速率下提供高質量的視頻流,是在線視頻和移動端視頻的理想選擇;H.265/HEVC 進一步提高了壓縮效率,在傳輸高清視頻流和 4K 視頻時所需的帶寬大約是 H.264 的一半。然而,新一代編解碼技術在節省帶寬的同時,也對算力提出了更高的要求。
盡管專用視頻加速卡(如 ASICs)和 GPU 在特定任務上展現出卓越性能,但通用服務器 CPU 因其出色的靈活性、廣泛的適用性以及更高的性價比,正在成為視頻轉碼場景中的主流選擇。隨著多核 CPU 架構和視頻編解碼技術的不斷進步,可以預見 CPU 在視頻轉碼領域的應用將更加廣泛。
在本文中,我們將探討基于 Armv9 架構的中興微電子“珠峰 1.0”芯片在 x264/x265 視頻轉碼場景下,所展現的可擴展算力和穩定核心,并通過與主流 x86 架構產品相比,展示珠峰芯片所具備的性能和能效優勢。
x264/x265 基準測試
“珠峰 1.0”是中興微電子發布的首顆領域定制融合處理器,搭載 128 個核心,主頻最高達到 3.1GHz。該芯片可提供指令集加速,比如 SVE/SVE2 等向量計算技術等,并在視頻轉碼等高算力場景中能夠讓工作負載以可預測的方式穩定運行。與此同時,依托于 Arm 成熟堅實的軟件生態和主流視頻編解碼庫中基于最新 Arm 架構指令的優化,珠峰芯片可以為視頻轉碼和其他云工作負載提供卓越的性能和能效收益。
x264 和 x265 作為主流的開源編解碼器實現在業界得到了廣泛的認可和應用,我們將通過實測 x264/x265 轉碼場景下的編碼速度(每秒幀數,FPS)來對比珠峰芯片和主流 x86 產品(英特爾 IceLake[1]、英特爾 Sapphire Rapids (SPR)[2] 和 AMD Milan[3])在多線程和整個 socket 配置下的性能和吞吐。
表 1:珠峰芯片和主流 x86 架構產品平臺配置
(配置: 內核: 6.0; GCC 編譯器: 12.2;
x86 開啟 turbo,1 線程 = 1 邏輯 CPU)
測試視頻:
https://ultravideo.fi/video/Bosphorus_1920x1080_120fps_420_8bit_YUV_Y4M.7z
測試命令腳本:
x264:
for cpu in ${cpulist[@]};do
cmd = numactl -C $cpu ${x264_DIR}/x264 -o output_${cpu}.mkv
${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --
frames 600 --threads 1 &
done
x265:
for cpu in ${cpulist[@]};do
cmd = numactl -C $cpu ${x265_DIR}/x265 -o output_${cpu}.mkv
${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --
frames 600 --no-wpp --pools ',' --frame-threads 1 &
done
<<< 左右滑動查看完整腳本 >>>
八線程轉碼測試
圖 1:單線程下 x264 的平均轉碼速率對比
圖 2:單線程下 x265 的平均轉碼速率對比
我們可以看到,在八線程的配置下,珠峰芯片在 x264/x265 轉碼場景中相比 x86 架構芯片平均每線程分別有 1.34 倍和 1.17 倍的性能優勢。
單 socket 轉碼測試
圖 3:單 socket 下 x264 轉碼速率對比
圖 4:單 socket 下 x265 轉碼速率對比
在單 socket 的配置下,珠峰芯片在 x264/x265 轉碼場景中相比 x86 架構芯片單 socket 分別有 2.96 倍和 2.54 倍的性能優勢。
轉碼能效比
除了擁有最佳的轉碼性能外,基于 Armv9 架構的珠峰芯片非常注重性能和功耗的平衡,卓越的能效可以極大地減少視頻轉碼中產生的碳足跡。下面是珠峰芯片和主流 x86 架構產品 (IceLake、SPR 和 Milan)熱設計功耗 (TDP) 的比較:
圖 5:熱設計功耗 (TDP) 對比
結論
在 x264/x265 視頻轉碼的場景下,我們可以清楚地看到基于 Armv9 架構的中興微電子珠峰芯片具備強勁的可擴展算力和穩定核心,測試結果顯示,與主流 x86 架構產品選擇相比(如英特爾至強第四代 Sapphire Rapids),該芯片提供了卓越的性能和能效,在運行 x264 時性能優勢高達 2.08 倍,而在運行 x265 時性能優勢高達 1.79 倍;此外,能效提升高達 1.35 倍。
-
處理器
+關注
關注
68文章
19799瀏覽量
233502 -
芯片
+關注
關注
459文章
52150瀏覽量
436014 -
ARM
+關注
關注
134文章
9304瀏覽量
374939 -
cpu
+關注
關注
68文章
11031瀏覽量
215961
原文標題:基于 Arm 架構的珠峰芯片加速極致視頻體驗
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論