倒計(jì)時(shí)1天!
2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會(huì)
邀您相聚云南,共話金融數(shù)字化
凝新聚智 網(wǎng)行天下!
隨著金融科技發(fā)展和數(shù)字化轉(zhuǎn)型深化,線上業(yè)務(wù)、移動(dòng)銀行等業(yè)務(wù)飛速發(fā)展,帶動(dòng)數(shù)據(jù)中心網(wǎng)絡(luò)規(guī)模和流量飛速增長(zhǎng),網(wǎng)絡(luò)運(yùn)維和網(wǎng)絡(luò)安全保障的復(fù)雜度與難度也日益提高。同時(shí)金融業(yè)務(wù)連續(xù)性要求7*24小時(shí)不中斷,金融賬務(wù)、交易等可回溯性要求高,也要求數(shù)據(jù)中心運(yùn)維更加智能和高效。為此中國(guó)農(nóng)業(yè)銀行(簡(jiǎn)稱(chēng)“農(nóng)行”)在ABC ONE+網(wǎng)絡(luò)新三年規(guī)劃的指導(dǎo)下,全面開(kāi)啟業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維的研究探索,并率先通過(guò)流量回溯與分析系統(tǒng)的創(chuàng)新和優(yōu)化,突破性實(shí)現(xiàn)網(wǎng)絡(luò)端到端流量采集、業(yè)務(wù)路徑還原和實(shí)時(shí)智能分析,為金融科技發(fā)展和數(shù)字化轉(zhuǎn)型保駕護(hù)航。
金融數(shù)字化轉(zhuǎn)型背景下的
運(yùn)維趨勢(shì)與挑戰(zhàn)
互聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)的發(fā)展促使數(shù)據(jù)中心的基礎(chǔ)架構(gòu)和管理對(duì)象正在發(fā)生天翻地覆的變化。一方面基礎(chǔ)架構(gòu)改變,云化和服務(wù)器資源池化驅(qū)動(dòng)網(wǎng)絡(luò)虛擬化發(fā)展,多云多地多數(shù)據(jù)中心成為諸多大行和股份制銀行的選擇。數(shù)據(jù)中心流量飛速增長(zhǎng),并從傳統(tǒng)“南北向流量為主”向“東西向流量為主”轉(zhuǎn)變,數(shù)據(jù)中心運(yùn)維的規(guī)模和復(fù)雜度日益提升。另一方面管理對(duì)象改變,數(shù)據(jù)中心從傳統(tǒng)的集中式大小機(jī)逐步轉(zhuǎn)向分布式架構(gòu),運(yùn)維和管理的對(duì)象也從“傳統(tǒng)的主機(jī)、設(shè)備等物理硬件”轉(zhuǎn)向“應(yīng)用、服務(wù)等軟件資源和數(shù)據(jù)”,數(shù)據(jù)中心運(yùn)維的管理范圍和要求逐步提高。
在這種背景下,IT運(yùn)維工具層出不窮,百花齊放。從傳統(tǒng)手動(dòng)運(yùn)維的“農(nóng)耕時(shí)代”,到自動(dòng)化運(yùn)維的“工業(yè)時(shí)代”,再到智能運(yùn)維的“智能時(shí)代”,運(yùn)維技術(shù)在近幾年實(shí)現(xiàn)了跨越式發(fā)展。然而在金融行業(yè)實(shí)際的管理和運(yùn)維中,因?yàn)槿狈\(yùn)維系統(tǒng)的統(tǒng)一規(guī)劃,在面對(duì)時(shí)好時(shí)壞的業(yè)務(wù)體驗(yàn)質(zhì)量、復(fù)雜的應(yīng)用遷移和上線策略,以及海量的日志告警,數(shù)據(jù)中心運(yùn)維逐步暴露出一些問(wèn)題,例如:

傳統(tǒng)網(wǎng)絡(luò)流量采集大多在物理設(shè)備旁路流量鏡像方式實(shí)現(xiàn),無(wú)法向下打開(kāi)虛擬網(wǎng)絡(luò)邊界,造成網(wǎng)絡(luò)監(jiān)測(cè)盲點(diǎn);而網(wǎng)絡(luò)運(yùn)維工具更關(guān)心網(wǎng)絡(luò)自身的狀態(tài),無(wú)法向上看到業(yè)務(wù)的整體性能,即便網(wǎng)絡(luò)感知到故障也無(wú)法判斷業(yè)務(wù)影響范圍。因此在實(shí)現(xiàn)業(yè)務(wù)互訪關(guān)系映射,以及實(shí)現(xiàn)Overlay網(wǎng)絡(luò)與Underlay網(wǎng)絡(luò)映射之后,如何實(shí)現(xiàn)業(yè)務(wù)狀態(tài)與網(wǎng)絡(luò)狀態(tài)的映射成為下一步業(yè)務(wù)與網(wǎng)絡(luò)可視化的難點(diǎn)。

一個(gè)數(shù)據(jù)中心可能會(huì)出現(xiàn)十多個(gè)不同的業(yè)務(wù)和網(wǎng)絡(luò)管理系統(tǒng),彼此之間猶如楚河漢界各自管理,并存在流量重復(fù)采集,以及信息不能有效聯(lián)動(dòng)的問(wèn)題。只有在收到故障告警需要聯(lián)合定位時(shí),再進(jìn)行人工協(xié)同判定問(wèn)題出現(xiàn)的位置和原因,往往耗費(fèi)數(shù)天,故障定界定位周期長(zhǎng)、效率低。

隨著數(shù)據(jù)中心分布式架構(gòu)變化,現(xiàn)網(wǎng)因分布式“多打一”造成的微突發(fā)、丟包等質(zhì)差問(wèn)題層出不窮。此類(lèi)問(wèn)題在業(yè)務(wù)層面僅能感知到卡頓或者性能下降,在網(wǎng)絡(luò)層面因?yàn)槿鄙傧到y(tǒng)性的數(shù)據(jù)分析和評(píng)估,難以主動(dòng)察覺(jué)和復(fù)現(xiàn),事后排障也沒(méi)任何依據(jù),只能手工檢查表項(xiàng)/告警等信息,耗時(shí)長(zhǎng)且對(duì)技術(shù)要求高。因此網(wǎng)絡(luò)部門(mén)只能配合業(yè)務(wù)部門(mén)反復(fù)進(jìn)行定位和分析,對(duì)網(wǎng)絡(luò)隱患系統(tǒng)性排查和提前識(shí)別提出了更高的要求。
因此,如何打破不同管理系統(tǒng)的責(zé)任邊界和管理范圍的桎梏,又不影響現(xiàn)網(wǎng)已有運(yùn)維系統(tǒng),是目前金融行業(yè)面臨的普遍的困難和挑戰(zhàn)。基于此,農(nóng)行堅(jiān)定地開(kāi)啟了業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維的新探索,并明確將全網(wǎng)端到端智能運(yùn)維作為數(shù)據(jù)中心運(yùn)維發(fā)展的路標(biāo)和方向。
跨越式演進(jìn)
農(nóng)行首次打破業(yè)務(wù)與網(wǎng)絡(luò)運(yùn)維邊界
2022年,為了打破業(yè)務(wù)與網(wǎng)絡(luò)的邊界,農(nóng)行啟動(dòng)業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維探索。一方面主動(dòng)梳理并摸排全行的運(yùn)維痛點(diǎn)和問(wèn)題,另一方面積極和華為等廠家交流,探索業(yè)界最新的技術(shù)和運(yùn)維方向,吸取各家所長(zhǎng)。最終,農(nóng)行流量回溯分析系統(tǒng)由業(yè)務(wù)性能管理系統(tǒng)和網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)兩部分構(gòu)成,并在該邏輯架構(gòu)基礎(chǔ)上進(jìn)行了如下創(chuàng)新實(shí)踐。

網(wǎng)絡(luò)運(yùn)維能力服務(wù)化,狀態(tài)主動(dòng)上送。為了快速向業(yè)務(wù)性能管理系統(tǒng)提供網(wǎng)絡(luò)數(shù)據(jù),網(wǎng)絡(luò)通過(guò)100+全量API實(shí)現(xiàn)服務(wù)化,并全面開(kāi)放網(wǎng)絡(luò)數(shù)據(jù)服務(wù),通過(guò)拖拽式整合即可快速發(fā)布場(chǎng)景化API與上層業(yè)務(wù)性能管理系統(tǒng)對(duì)接,打破了傳統(tǒng)硬編碼開(kāi)發(fā)的模式,大大縮短了系統(tǒng)間集成周期。

流量鏡像疊加,端到端路徑還原。為了對(duì)業(yè)務(wù)進(jìn)行全面的質(zhì)量保障,實(shí)現(xiàn)全面流量鏡像,農(nóng)行在DC出口、Fabric出口、VAS設(shè)備互聯(lián)口等關(guān)鍵節(jié)點(diǎn)進(jìn)行邊界出口全流鏡像,并由業(yè)務(wù)性能管理系統(tǒng)進(jìn)行會(huì)話與網(wǎng)絡(luò)性能分析;在Fabric內(nèi)部基于TCP特征報(bào)文進(jìn)行ERSPAN流鏡像,并上送給網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)還原Fabric內(nèi)轉(zhuǎn)發(fā)路徑。最后通過(guò)兩種流量鏡像疊加,實(shí)現(xiàn)了端到端鏡像和路徑還原,并支持鏡像流量的去重、解密和脫敏等,減輕分析段壓力。

AI智能分析與推理,網(wǎng)絡(luò)風(fēng)險(xiǎn)智能評(píng)估。為了實(shí)現(xiàn)全量風(fēng)險(xiǎn)評(píng)估,網(wǎng)絡(luò)通過(guò)采集設(shè)備的ERSPAN流、Telemetry性能Metrics進(jìn)行大數(shù)據(jù)分析,并結(jié)合AI算法主動(dòng)感知網(wǎng)絡(luò)可能存在的故障,智能分析識(shí)別是否存在網(wǎng)絡(luò)或者應(yīng)用的群體性故障,逐步實(shí)現(xiàn)故障主動(dòng)感知、分鐘級(jí)故障定位定界的主動(dòng)智能運(yùn)維目標(biāo)。
分鐘級(jí)根因分析
邁出端到端智能運(yùn)維第一步
通過(guò)如上探索,農(nóng)行流量回溯分析系統(tǒng)實(shí)現(xiàn)了“業(yè)務(wù)質(zhì)量分析→網(wǎng)絡(luò)會(huì)話分析→網(wǎng)絡(luò)路徑分析→故障根因定位”的端到端立體化運(yùn)維,能夠提供覆蓋Underlay與Overlay的業(yè)務(wù)和網(wǎng)絡(luò)性能分析能力;打通業(yè)務(wù)、會(huì)話、網(wǎng)絡(luò)問(wèn)題分析路徑,快速發(fā)現(xiàn)并定位質(zhì)差問(wèn)題;同時(shí)滿(mǎn)足問(wèn)題定界、全網(wǎng)路徑分析、質(zhì)差主動(dòng)感知等具體分析場(chǎng)景。最終達(dá)到了如下效果:

農(nóng)行流量回溯與分析系統(tǒng)支持對(duì)220+金融業(yè)務(wù)性能指標(biāo),包括交易量、交易成功率、交易時(shí)延等業(yè)務(wù)層指標(biāo)的實(shí)時(shí)分析,可主動(dòng)感知交易質(zhì)量下降,一鍵追蹤全路徑交易并識(shí)別異常服務(wù)節(jié)點(diǎn)。

實(shí)時(shí)感知業(yè)務(wù)異常后,農(nóng)行流量回溯與分析系統(tǒng)支持將業(yè)務(wù)交易的全服務(wù)路徑與業(yè)務(wù)流的網(wǎng)絡(luò)轉(zhuǎn)發(fā)路況進(jìn)行一鍵關(guān)聯(lián),發(fā)現(xiàn)異常后可以跳轉(zhuǎn)到網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)進(jìn)行聯(lián)合分析,打通業(yè)務(wù)-會(huì)話-網(wǎng)絡(luò)E2E分析路徑,快速進(jìn)行責(zé)任定界。

網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)采用規(guī)則引擎、智能化引擎、知識(shí)圖譜等技術(shù)進(jìn)行大數(shù)據(jù)挖掘分析,對(duì)全網(wǎng)基礎(chǔ)資源統(tǒng)一建模,將網(wǎng)絡(luò)對(duì)象、事件、傳播關(guān)系進(jìn)行聯(lián)合分析,推理網(wǎng)絡(luò)故障根因,實(shí)現(xiàn)對(duì)故障的分鐘級(jí)根因分析。同時(shí)通過(guò)AI算法將多個(gè)網(wǎng)絡(luò)指標(biāo)進(jìn)行關(guān)聯(lián),提前識(shí)別網(wǎng)絡(luò)中可靠性、容量、性能、穩(wěn)定性等隱患,統(tǒng)一評(píng)估全網(wǎng)潛在風(fēng)險(xiǎn),由被動(dòng)救火向主動(dòng)運(yùn)維轉(zhuǎn)變,降低故障發(fā)生概率。
農(nóng)行流量回溯分析系統(tǒng)的創(chuàng)新實(shí)現(xiàn)了端到端智能運(yùn)維的新突破,讓業(yè)務(wù)與網(wǎng)絡(luò)不再割裂,實(shí)現(xiàn)了業(yè)務(wù)和網(wǎng)絡(luò)運(yùn)維數(shù)據(jù)的融合。未來(lái),農(nóng)行端到端智能運(yùn)維將進(jìn)一步從物理網(wǎng)絡(luò)、虛擬網(wǎng)絡(luò)向全棧云網(wǎng)絡(luò)演進(jìn),并進(jìn)一步打通數(shù)據(jù)中心內(nèi)、數(shù)據(jù)中心間,以及分支互聯(lián)的運(yùn)維通道,實(shí)現(xiàn)全局全網(wǎng)一體化運(yùn)維,提升整網(wǎng)運(yùn)維管理效率和業(yè)務(wù)連續(xù)性水平,保障農(nóng)行數(shù)字化轉(zhuǎn)型邁向新篇章。

原文標(biāo)題:2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會(huì) | 農(nóng)行網(wǎng)絡(luò)流量回溯與分析實(shí)現(xiàn)新突破,探索端到端運(yùn)維新模式
文章出處:【微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
華為
+關(guān)注
關(guān)注
216文章
35016瀏覽量
254927
原文標(biāo)題:2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會(huì) | 農(nóng)行網(wǎng)絡(luò)流量回溯與分析實(shí)現(xiàn)新突破,探索端到端運(yùn)維新模式
文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
曙光網(wǎng)絡(luò)發(fā)布網(wǎng)絡(luò)流量回溯分析平臺(tái)SUNA
華為面向中東中亞地區(qū)發(fā)布全新星河AI園區(qū)網(wǎng)絡(luò)
廣東移動(dòng)聯(lián)合華為推出SPN網(wǎng)絡(luò)運(yùn)維故障智能體方案
華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2025成功舉辦
中興通訊推出基于AI驅(qū)動(dòng)的全新端到端網(wǎng)絡(luò)解決方案
國(guó)產(chǎn)萬(wàn)兆以太網(wǎng)通信芯片提供端到端的車(chē)載網(wǎng)絡(luò)解決方案

網(wǎng)絡(luò)流量監(jiān)控與網(wǎng)關(guān)優(yōu)化
端到端自動(dòng)駕駛技術(shù)研究與分析
端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

行業(yè)智能化的“火車(chē)頭效應(yīng)”,由星河AI金融網(wǎng)絡(luò)啟動(dòng)

實(shí)現(xiàn)自動(dòng)駕駛,唯有端到端?

軟通動(dòng)力亮相華為云云商店數(shù)智創(chuàng)新峰會(huì)
捷科亮相2024阿里云金融創(chuàng)新峰會(huì),推動(dòng)金融科技領(lǐng)域數(shù)智轉(zhuǎn)型

華為成功舉辦數(shù)據(jù)通信創(chuàng)新峰會(huì)北非站,助力非洲網(wǎng)絡(luò)智能化發(fā)展

艾體寶干貨 | 教程:使用ntopng和nProbe監(jiān)控網(wǎng)絡(luò)流量

評(píng)論