如果將工業設備與一臺閃存陣列放在一起,會發生什么?你可能想象不到,日久天長,閃存控制器中的線路板可能會被慢慢腐蝕甚至溶解。若恰巧這臺“傻大黑粗”的閃存陣列并不具備智能化的故障預測功能,當系統中斷或發生數據丟失時才被用戶察覺,一切將為時晚矣。
你也許會說,上述只是極端的例子或小概率事件,但是隨著業務互聯網化和移動化趨勢的加劇,很多行業的銷售行為由5×8小時變成7×24小時后,數據基礎設施層面的任何一點疏忽大意或不能被預測的故障對于企業的生存和發展都可能造成滅頂之災。這也是為什么最近幾年AIOps突然在數據基礎設施領域爆紅的重要原因之一。
1不要再做“事后諸葛亮”
AIOps最早是由Gartner在2016年提出的概念,它旨在借助大數據分析和機器學習算法自動地從海量運維數據中不斷分析和學習,實現異常檢測、瓶頸熱點分析和多維關系分析等,從而幫助IT運維人員準確甄別系統異常、快速定位故障根因,并對系統運行的潛在風險進行主動預測,提前告警,最終實現IT基礎設施和業務的持續洞察和主動優化改進。
隨著云計算、大數據、人工智能等技術的深入融合和綜合應用,AIOps也開始快速向各個細分領域滲透,尤其是在數據基礎設施層面,智能運維已經成了各大存儲廠商新的必爭之地。現在回想起來,HPE當初大手筆收購Nimble Storage是另有深意,落腳點是其基于云的智能運維平臺InfoSight。如今,HPE正將InfoSight逐步引入到整個存儲和服務器產品線中,包括Primera、Nimble存儲,以及ProLiant服務器、Synergy組合式基礎設施和Apollo系統等,而InfoSight也成了名副其實的“幕后英雄”,提供了基礎架構層面的全局可見性、預測分析能力和推薦引擎等功能。
Gartner的研究顯示,2020年,AIOps在全球的采用率達到50%,AIOps成為運維最主要的工具。IDC在最近發布的《IDC FutureScape: 全球人工智能(AI)市場2021 預測——中國啟示》報告中也做出了類似的預測:到2024年,AIOps將成為IT運營的“新常態”,至少有50%的大型企業將采用自動化運維解決方案來自動化其主要IT系統和服務管理過程。
從數字化轉型到智能化升級,今天我們再談到無人值守的數據中心、無人工廠或無人駕駛,大家不再認為是天方夜譚,隨著智能化技術的持續演進,這一切將更快地變成現實。從宏觀市場的角度看,2020年,“新基建”的火爆讓我們更加清楚地認識到,建設以“數據+智能”為核心的新型數據基礎設施刻不容緩,這是賦能千行百業智能升級、服務各種各樣智慧化的應用場景,推動經濟高質量發展的必然趨勢。
從數據基礎設施穩定高效運行的微觀層面看,智能運維有望徹底改變以前“事后諸葛亮”的狀況,發揮先知先覺的作用,主動并提前預測數據基礎設施中潛在的風險和故障,從而更好地實現整個系統的自管理、自修復和自優化,提高數據基礎設施的運行效率,驅動業務發展,降低成本。
2智能化,存儲發展的又一風向標
大數據是新的生產資料,而人工智能是新的生產力,這些新的生產要素組合在一起,將給各行各業帶來深刻變革甚至是顛覆。肆虐2020年的新冠疫情,就讓我們再次領略了由數據激發的洞察力,同時疫情也刺激了數據智能市場的跨越式前進。
從行業用戶的具體需求來分析,數字化和智能化已成為金融企業致勝未來的關鍵要素。在智慧金融場景中,數據基礎設施必須保證即時、高效、穩定,而服務則要在數據基礎設施之上實現敏捷發布、快速迭代,其最根本的保障在很大程度上就來源于數據基礎設施的智能運維和自動化。中信銀行就在完善和優化其數據基礎設施的過程中,采用了華為DME數據管理引擎,在融合管理、業務變更以及統一運維等場景引入了安全可控的自動化和智能化能力,從而顯著提升了運維效率和業務的敏捷水平,一舉多得。
再來看看電力行業的情況,電網公司在業務整合和數字化的過程中對存儲管理提出了更高的要求。由于歷史原因,系統中擁有多個品牌、多個系列的存儲設備,管理的復雜性和運維風險持續走高。為進一步完善數據存儲管理,提高效率,就必須采用集約式、規范化的存儲管理模式,充分實現存儲運維管理的自動化和智能化。
綜上,無論是從市場和技術的發展趨勢,還是從行業客戶的實際需求來看,存儲與人工智能技術的深入融合勢在必行,將極大地降低存儲運維的成本、復雜度和風險。當前,存儲的智能化運維正在形成一股新的潮流。一些以智能化見長的存儲創業企業也如雨后春筍般不斷涌現。
我們也欣喜地看到,整個存儲業界對智能運維的重視程度不斷提升。2020年12月,DOIT在一年一度的“百易獎”評選中就特別設立了“2020年度人工智能技術創新獎“,并授予了華為DME(Data Management Engine,數據管理引擎)數據管理與運維自動化解決方案。該解決方案創新性地引入三層AI架構,實現數據中心存儲網絡的自動化資源發放、智能運維以及智能數據流動,助力運維極簡以及業務敏捷創新。毋庸置疑,智能化將成為引領存儲未來發展的又一重要風向標。
3華為存儲引領AIOps創新
存儲行業是一個需要高研發投入和長期積累的行業,尤其是在一些核心技術的研發和相關能力的建設上更是如此,也由此建立了高門檻。華為是一家端到端IT基礎設施解決方案提供商,而智能運維是IT基礎設施中一項不可或缺的能力,可想而知華為在這方面擁有多年的積累和成功實踐。隨著智能化在存儲中的地位進一步凸顯,在Gartner定期發布的全球主存儲市場魔力象限中,居領導者地位的廠商一定也是在智能運維方面擁有特長的。而華為如今已是這一象限的常客,在與國際知名大廠商的博弈中,并不落下風。
受到業界充分肯定的華為DME是華為數據基礎設施智能運維平臺,該平臺通過與存儲設備內置的設備AI以及云端AI(eService)實現三層AI協同,并通過融合統一的管理界面、自動化的閉環機制以及開放的API,旨在使能數據存儲的從規劃到建設、運維、優化的全生命周期場景管理與運維自動化,從而幫助客戶簡化存儲管理,提升數據中心的運營效率。
華為存儲基于存儲AI“四大范式”,持續引領業界AIOps創新。
范式一,Workload指紋,業務識別的準確率高于80%,可將資源使用效率提升30%,主要應用于數據安置、數據流動、硬件擴容、業務擴容等場景。舉例來說,可以實現基于策略的SLA變更功能,讓關鍵業務始終可以獲得更好的存儲資源保障,確保業務穩定運行。
范式二,知識圖譜,分鐘級快速定位到可恢復單元,主要應用于全棧拓撲可視化、VM到存儲E2E分析、告警關聯/根因分析、擾鄰分析等場景。舉例來說,可以實現告警關聯分析、一鍵式影響范圍評估,從而提升問題分析效率;實現性能異常預測,KPI關聯分析以及修復方案推薦,2019年在某交通集團有限公司,eService檢測到華為OceanStor 5500 V5存儲峰值寫時延達到190.66ms后,建議開啟SmartTier功能,使得時延恢復正常。
范式三,介質故障預測,可提前14天預知故障,故障識別率高于80%,誤報率則低于0.1%,主要應用于整盤故障、盤局部故障、內存失效、光模塊故障等場景。舉例來說,可以實現HDD、SSD故障盤預測,通過選取故障時刻前14天的數據作為故障樣本,分析數據分布、增長趨勢、特征相關性和重要度,進行大樣本學習方法并在11萬塊盤上訓練和測試,效果顯著優于隨機抽樣選擇訓練集方法,2018年6月華為數據中心就曾在一個月內預測出3塊故障硬盤;使用AI算法進行內存故障模式識別和內存故障預測,并結合內存Bank隔離等措施,實現內存局部故障自修復和內存故障預告警,減少內存故障引起的系統宕機。
范式四,性能容量預測,性能預測準確率高于85%,主要應用于性能瓶頸預測、容量瓶頸預測、KPI異常分析、網絡亞健康分析等場景。舉例來就,針對存儲資源(前端端口、控制器、Cache、存儲池、LUN和磁盤)的性能異常進行實時監控,提前獲知性能指標(IOPS、時延和IO帶寬)的變化趨勢,幫助客戶提前規劃,降低性能事故率。
實現容量趨勢預測,采用集成學習技術,將多種基于時間序列的預測算法加權集成,充分捕捉多種時間序列特征,實現精準預測;利用CNN神經網絡預測業務未來的性能趨勢,該模型使用華為全網的LUN在過去3個月內的性能數據大規模訓練完成;性能潮汐分析,將規律以熱力圖方式進行呈現,某市區政府就根據潮汐熱力圖主動選擇最合適的升級時間窗口,避免了業務高峰期操作可能對業務造成的不良影響。
上述諸多例證表明,人工智能技術的應用,在優化存儲基礎設施、存儲資源配置、性能優化,以及提升自動化和智能化水平方面功不可沒。當前,對于存儲智能化的探索正漸入佳境,打造智能數據基礎設施將是企業智能化升級的必由之路。
責任編輯:xj
-
華為
+關注
關注
216文章
35207瀏覽量
255841 -
AI
+關注
關注
88文章
35093瀏覽量
279493 -
儲存
+關注
關注
3文章
202瀏覽量
22726
發布評論請先 登錄

酒店智能化都用到哪些芯片之高速互聯型MCU CH32V317
告別協議沖突!Modbus轉Profinet助力風速風向儀無縫對接
智能化管理系統:驅動未來管理與效率革命
2025廣州汽車測試測量展:行業風向標,引領未來新趨勢

Vision Pro或停產?2024年XR設備與智能眼鏡呈反向成長
達實智能亮相2024建筑智能化創新與發展論壇
超聲波液位計的智能化發展趨勢
LED智慧一體機已成為高端超微小間距COB顯示領域的風向標
【?嵌入式機電一體化系統設計與實現?閱讀體驗】+《智能化技術在船舶維護中的應用探索》
光峰科技T2激光電視助力智能家居發展
數字孿生技術驅動未來智能化發展
配電室智能化的發展方向是什么?

評論