當代社會的生產和生活在許多方面都離不開龐大復雜的軟硬件系統,包括互聯網、高性能計算、電信、金融、電力網絡、物聯網、醫療網絡和設備、航空航天、軍事裝備和網絡等。
這些系統的用戶需要良好的用戶體驗。因此,這些復雜系統的部署、運行和維護需要專業的運行維護人員來應對各種突發事件,確保系統的安全可靠運行。因為各種突發事件都會產生大量的數據,從本質上講,智能運維可以看作是大數據分析的具體場景。
智能操作和維護的范圍是機器學習、軟件工程、行業知識、操作和維護場景知識在四者結合的交叉領域,智能運維的順利發展離不開四者的密切配合。
得益于大數據和人工智能,今天的運營維護模式開始走向智能化階段,越來越多的企業開始重視智能化運營維護。公司和組織采用集中監控平臺收集系統的各種運行狀態和執行邏輯信息,如網絡流量、服務日志等等等來實現綜合感知。隨著系統規模的增長,運維數據也呈爆炸式增長。每天產生數千億的監測數據和日志,給運行維護帶來各種困難和挑戰,推動了智能運行維護技術的不斷發展。
相較于手動運維,自動化運維極大地提升了運維的效率,DevOps提升了研發和運維的配合效率。然而當整個互聯網系統的數據規模開始爆炸性增長和服務類型的復雜多樣,基于人為指定規則的專家系統遇到了諸多瓶頸,其中很重要的一條是:對于長期從事某行業運行維護工作的專家來說,手工總結重復、可追溯的現象,形成規則,完成自動運行維護是非常必要的。然而,這種基于人工規則的方法并不能解決大規模的運行維護問題。
與依賴人工生成規則的自動操作和維護不同,智能操作和維護強調機器學習算法從海量運維數據中自動學習(包括事件本身和運維人員人工處理日志),完善和總結規則。也就是說,智能運維在自動運維的基礎上增加了一個基于機器學習的大腦,它命令監控系統采集大腦決策所需的數據,進行分析、決策,并命令自動腳本執行大腦決策,從而達到系統運行維護的總體目標。
高德納報告預測,全球aiops的部署率將從2017年的10%提高到2020年的50%。
-
物聯網
+關注
關注
2931文章
46243瀏覽量
392438 -
機器學習
+關注
關注
66文章
8503瀏覽量
134603 -
大數據
+關注
關注
64文章
8960瀏覽量
140208
發布評論請先 登錄
FPGA在機器學習中的具體應用
【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用
C++學到什么程度可以找工作?
機器學習模型市場前景如何
【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊
華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

如何選擇云原生機器學習平臺
什么是機器學習?通過機器學習方法能解決哪些問題?

NPU與機器學習算法的關系
LSTM神經網絡與其他機器學習算法的比較
人工智能、機器學習和深度學習存在什么區別

LIBS結合機器學習算法的江西名優春茶采收期鑒別

評論