NVIDIA NetQ 是一種高度可擴(kuò)展的現(xiàn)代網(wǎng)絡(luò)操作工具,為 NVIDIA Spectrum Ethernet 平臺(tái)提供可操作的可見性。它將高級(jí)遙測(cè)技術(shù)與用戶界面相結(jié)合,使網(wǎng)絡(luò)工作流程更易于故障排除和自動(dòng)化,同時(shí)減少維護(hù)和停機(jī)時(shí)間。
我們最近發(fā)布了 NetQ 4.2.0 ,其中包括:
簡(jiǎn)化的事件管理
增強(qiáng)的流量遙測(cè)分析
新 RoCE 驗(yàn)證
新增 DPU 監(jiān)控
有關(guān)新功能和增強(qiáng)功能的更多信息,請(qǐng)參閱 NetQ 4.2.0 用戶指南。
簡(jiǎn)化的事件管理
通過 NetQ 4.2 ,我們簡(jiǎn)化了通過接口傳遞網(wǎng)絡(luò)事件的方式。事件的嚴(yán)重性各不相同。一些事件是網(wǎng)絡(luò)警報(bào),可能需要進(jìn)一步調(diào)查,而其他事件是信息性通知,可能不需要干預(yù)。在此版本之前,NetQ 將報(bào)警和信息事件顯示為兩個(gè)單獨(dú)的卡。NetQ 4.2 版本將兩個(gè)卡合并為一個(gè)卡,擴(kuò)展后,該卡將顯示一個(gè)儀表板,以幫助您快速可視化所有網(wǎng)絡(luò)事件。
圖 1 . NetQ 事件儀表板
儀表板顯示事件的時(shí)間線,以及導(dǎo)致大多數(shù)事件的開關(guān)。您可以按類型篩選事件,包括接口、網(wǎng)絡(luò)服務(wù)、系統(tǒng)和閾值交叉事件。
確認(rèn)事件有助于您專注于需要您關(guān)注的活動(dòng)事件。從儀表板中,還可以創(chuàng)建規(guī)則以抑制事件。此功能還可幫助您關(guān)注活動(dòng)事件,從而使已知問題或錯(cuò)誤警報(bào)的顯示方式與錯(cuò)誤顯示方式不同。
增強(qiáng)的流量遙測(cè)分析
NetQ 4.1.0 為 Cumulus Linux 5.x 數(shù)據(jù)中心結(jié)構(gòu)引入了結(jié)構(gòu)范圍的網(wǎng)絡(luò)延遲和緩沖區(qū)占用分析。現(xiàn)在,NetQ 4.2 支持混合結(jié)構(gòu)中的部分路徑流遙測(cè)分析,即那些將 Cumulus Linux 5.x 交換機(jī)與其他交換機(jī)(包括非 Cumulus Linux 5.x 和第三方交換機(jī))結(jié)合使用的結(jié)構(gòu)。Cumulus Linux 5.x 設(shè)備在路徑中顯示流量統(tǒng)計(jì)信息,例如延遲和緩沖區(qū)占用。不受支持的設(shè)備在流量分析中表示為帶有紅色 X 的黑條,并且設(shè)備不顯示流量統(tǒng)計(jì)信息。
圖 2 . NetQ 流量遙測(cè)分析結(jié)果
此外,NetQ 4.2 流量遙測(cè)分析顯示了所分析流量的上下文“剛剛發(fā)生的事情”(WJH)事件和下降。帶有 WJH 事件的交換機(jī)在流分析圖中表示為紅色條紋條。將鼠標(biāo)懸停在帶有紅色條的設(shè)備上,會(huì)顯示 WJH 事件摘要。
圖 3 . 利用 WJH 數(shù)據(jù)進(jìn)行 NetQ 流量遙測(cè)分析
新 RoCE 驗(yàn)證
通過聚合以太網(wǎng)使用 RDMA (RoCE),您可以通過以太網(wǎng)使用遠(yuǎn)程直接內(nèi)存訪問(RDMA)而不是使用主機(jī) CPU 來寫入計(jì)算或存儲(chǔ)元素。NetQ 4.0.0 引入了 RoCE 配置和計(jì)數(shù)器,包括設(shè)置各種 RoCE 閾值交叉警報(bào)(TCA)的能力。
使用 NetQ 4.2.0 ,RoCE 驗(yàn)證檢查:
交換機(jī)間有損或無損模式配置的一致性
DSCP 、服務(wù)池、端口組和流量類設(shè)置的一致性
ECN 閾值設(shè)置的一致性
無損模式 PFC 配置的一致性
增強(qiáng)型變速箱選擇設(shè)置的一致性
您可以安排 RoCE 驗(yàn)證定期或按需運(yùn)行。
新增 DPU 監(jiān)控
NVIDIA BlueField DPU(數(shù)據(jù)處理器)通過卸載、加速和隔離廣泛的高級(jí)網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù),為任何工作負(fù)載提供安全、加速的基礎(chǔ)架構(gòu)。
NetQ 幫助您監(jiān)控網(wǎng)絡(luò)上的 DPU 庫存。您可以監(jiān)視 DPU 操作系統(tǒng)、ASIC 、CPU 型號(hào)、磁盤和內(nèi)存信息,以幫助管理升級(jí)、法規(guī)遵從性和其他規(guī)劃任務(wù)。使用 NetQ ,您可以查看和監(jiān)視鍵 DPU 屬性,包括已安裝的軟件包以及 CPU 、磁盤和內(nèi)存利用率。
圖 4 . NetQ- DPU 利用率詳細(xì)信息
在本文中,您已經(jīng)看到了 NetQ 4.2.0 提供的一些新功能的概述。有關(guān)更多信息,參閱 NetQ 4.2.0 用戶指南,并使用 NVIDIA Air 瀏覽 NetQ 。
原文標(biāo)題:使用最新版本的 NVIDIA NetQ 自動(dòng)化網(wǎng)絡(luò)監(jiān)控并減少停機(jī)時(shí)間
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106408 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7815瀏覽量
90960 -
DPU
+關(guān)注
關(guān)注
0文章
393瀏覽量
24937
原文標(biāo)題:使用最新版本的 NVIDIA NetQ 自動(dòng)化網(wǎng)絡(luò)監(jiān)控并減少停機(jī)時(shí)間
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA DOCA 3.0版本的亮點(diǎn)解析

CANoe產(chǎn)品體系19版本新特性及新增Option(上)

NVIDIA虛擬GPU 18.0版本的亮點(diǎn)
Altium Designer 25.4.2版本的新功能

NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析
motorBench 2.45.0版本說明

SOLIDWORKS 2025 PDM新增功能

OurBMC 24.12版本正式上線
SOLIDWORKS 2025引入了多項(xiàng)新增工具和增強(qiáng)功能
解析NVIDIA JetPack 6.1的新功能

NVIDIA DOCA 2.9版本的亮點(diǎn)解析

淺談Xpedition 2409版本的新功能
NVIDIA Parabricks v4.3.1版本的新功能

NVIDIA JetPack 6.0版本的關(guān)鍵功能

評(píng)論