隨著運營商數據中心的規模越來越大,服務器數量越來越多,智能化程度越來越高,數據中心網絡運維遇到了三方面的挑戰。
首先,故障發現難。網絡的連接狀態、資源使用狀態和策略狀態對于運維人員來說是一個黑盒。當網絡故障時,網絡運維人員無法第一時間感知,而是要等到被業務部門投訴時才知道網絡發生了故障,但此時也無法及時知道網絡到底哪里出了故障。據統計,有85%以上的網絡故障在業務部門投訴后才能被網絡部門發現。久而久之,網絡部門成了“背鍋俠”,無法自證清白。
其次,故障定位難。傳統運維采用SNMP協議每5分鐘收集一次網絡信息,周期長、效率低。而且,傳統運維的定位手段只能通過查看日志的方式從海量的故障告警和日志信息中根據個人經驗排查定位問題,效率極其低下。據統計,一個故障的平均定位時間需要至少76分鐘。網絡運維人員直呼“寶寶心里苦啊”。
最后,業務感知難。隨著云和SDN的發展,網絡業務的配置方式從傳統的人工配置演變為由云平臺和控制器配置的方式,網絡管理員很難實時感知到網絡的變化。
面對這些網絡運維的難題,華為提出了從“網絡應用—>網絡路徑-->網絡設備”三個層面進行關聯分析的FabricInsight網絡智能分析器,構建“秒級故障感知、分鐘級故障定位”的智能運維能力。
華為FabricInsight網絡智能分析器架構
華為FabricInsight提供如下四大功能:
FabricInsight采用Telemetry技術實現秒級的數據獲取,并基于ERSPAN流鏡像實現訂閱發布,按需使用。眾所周知,Telemetry一次可以獲取多個數據,編碼效率很高。這樣FabricInsight具備了實時獲取數據的能力,為分析器挖掘數據提供了堅實基礎和關鍵依賴。
數據獲取器將從網絡中獲取到的大量網絡狀態數據匯聚到大數據分析平臺。這個平臺可以對百億級的數據進行高效檢索和分析。
大數據分析平臺基于內置的AI算法對獲取到的網絡狀態數據從“網絡應用->網絡路徑->網絡設備”的層面進行關聯分析,包括:網絡連接類、網絡性能類、網絡策略類和網絡資源類等方面的故障分析。
邊緣交換機上的智能芯片可以實現故障模式的匹配和根因分析,進而實現分布式智能的深度故障分析和按需全流分析。
華為FabricInsight的卓越功能使其具備了一鍵式智能診斷、主動預測性維護和基于流可視的邊緣智能的三大特點,并在實踐中有了廣泛應用。
以光模塊故障概率預測為例,這幫助網絡運維人員提前判斷光模塊的故障概率和“健康狀態”。
網絡接口上數據的收發都需要通過光模塊。光模塊長時間運行會引起光器件的性能衰減,從而導致鏈路不穩定。而這種不穩定的“亞健康”狀態既沒有故障告警,又影響數據收發的完整性。傳統運維手段無法在光模塊已老化、故障發生之前及時識別風險并進行預警。光模塊的這種“亞健康”狀態會導致網絡提供給業務的服務質量下降,使網絡處于一種“可用”與“不可用”的間歇性中斷的臨界狀態,極大影響業務質量感知。
光模塊的三個狀態
華為FabricInsight通過Telemetry實時獲取光模塊KPI,在光模塊視圖呈現全網光模塊的狀態,包括:已經故障、可能故障以及故障概率分布。用戶在光模塊視圖通過矩形視圖就可以通過不同的顏色方便快速地識別已經故障和高故障率的光模塊。選中高故障率光模塊,就可以查看故障概率預測曲線。用戶還可以結合光模塊的接收功率、發送功率、電流、電壓、溫度的動態曲線等參數輔助判斷光模塊的運行狀態。結合AI算法和人工排查,用戶可以對光模塊的運行狀態進行準確預測,大大提高運維效率,提供良好的業務感知。
華為FabricInsight光模塊狀態預測界面
綜述,傳統運維面對的是靜態網絡,采用從網絡向上看業務的視角進行運維。而在云化時代和AI時代,網絡會隨業務動態變化,傳統運維手段大多失效或者低效,需要采用從業務向下看網絡的視角進行網絡運維,并結合AI算法實現應用與網絡的關聯分析,解決網絡故障發現難、定位難和業務感知難的問題。華為FabricInsight智能運維完美地解決了這些問題,為運營商邁入智能時代保駕護航。
-
運營商
+關注
關注
4文章
2413瀏覽量
45076 -
華為
+關注
關注
216文章
35055瀏覽量
255176
原文標題:華為FabricInsight智能運維為運營商邁入智能時代保駕護航
文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數據通信】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
微軟 Build 2025大會:筑牢智能體時代的安全新防線

華為AI重塑核心網運維模式助力運營商實現數智化轉型,邁向AN L4
華為智能運維解決方案榮獲GSMA GLOMO兩項大獎
充電樁“耐力大考驗”:老化負載研究,為持久續航保駕護航
安科瑞蓄電池在線監控系統為鐵塔基站的穩定運行保駕護航

華為黨文栓:憧憬智能時代的運營商
光伏電站智能運維管理系統:點亮綠色能源未來之光

瑞隆源產品符合性檢驗中心PCIC--為浪涌產品質量保駕護航

防爆智能手機如何助力電氣行業保駕護航?

評論