女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用機(jī)器學(xué)習(xí)解決數(shù)據(jù)庫(kù)運(yùn)維難題

西西 ? 來(lái)源:feiyan ? 作者:51cto ? 2018-12-02 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

回顧整個(gè)運(yùn)維的發(fā)展史,從最開(kāi)始的系統(tǒng)管理到基礎(chǔ)腳本運(yùn)維,再到自動(dòng)化運(yùn)維,最后發(fā)展到了智能運(yùn)維。經(jīng)過(guò)這些年的發(fā)展,運(yùn)維人員的工作內(nèi)容發(fā)生了翻天覆地的變化:

十幾年前,我們不知道故障會(huì)出現(xiàn)在哪,也不知道什么時(shí)候會(huì)出現(xiàn)故障,只有在故障出現(xiàn)的時(shí)候才能去查找根因并解決故障,這是一種很被動(dòng)的方法。

到后來(lái)大規(guī)模的腳本引入,我們處理問(wèn)題的方式變得更加科學(xué)了,速度也差強(qiáng)人意,但還是沒(méi)有改變這一種被動(dòng)解決問(wèn)題的本質(zhì)現(xiàn)象;有了先前的經(jīng)驗(yàn),很多公司引入了監(jiān)控系統(tǒng),發(fā)展了自己的自動(dòng)化運(yùn)維平臺(tái),旨在問(wèn)題發(fā)生或者即將發(fā)生時(shí)能夠自動(dòng)地去解決問(wèn)題,這種方式剛突破了之前所有的“被動(dòng)運(yùn)維”的本質(zhì),能夠防患于未然,將故障扼殺在搖籃中。但與之而來(lái)的卻是大量的告警及海量的監(jiān)控?cái)?shù)據(jù),如何更加高效地解決故障成了我們現(xiàn)在必須解決的難題。

人工智能時(shí)代的來(lái)臨恰好解決了上面我們所面臨的問(wèn)題,而AIOps就是希望基于已有的運(yùn)維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),并通過(guò)機(jī)器學(xué)習(xí)的方式來(lái)進(jìn)一步解決自動(dòng)化運(yùn)維沒(méi)辦法解決的問(wèn)題。

我們目前正在積極推動(dòng)數(shù)據(jù)庫(kù)運(yùn)維從自動(dòng)化到智能化的轉(zhuǎn)變。眾所周知,數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)離不開(kāi)海量的數(shù)據(jù)作為基礎(chǔ),而平安科技通過(guò)這幾年的自動(dòng)化運(yùn)維的應(yīng)用,已經(jīng)積累了海量多維的數(shù)據(jù)庫(kù)性能數(shù)據(jù)、日志數(shù)據(jù)和主機(jī)數(shù)據(jù)。

利用這些數(shù)據(jù),我們可以通過(guò)機(jī)器學(xué)習(xí)等方法在時(shí)間序列異常檢測(cè)、根因分析、郵件告警收斂、容量預(yù)測(cè)等多個(gè)應(yīng)用場(chǎng)景中獲取我們想要的信息,從而進(jìn)行故障的自動(dòng)發(fā)現(xiàn)、自動(dòng)診斷和自動(dòng)解決。

一、時(shí)間序列異常檢測(cè)

時(shí)序數(shù)據(jù)是AIOps的基礎(chǔ)數(shù)據(jù),有著規(guī)模大、種類多、需求多樣的特點(diǎn)。在自動(dòng)化運(yùn)維階段,我們所采用的大多是恒定閾值的方法。

這種方法簡(jiǎn)單易實(shí)現(xiàn),但是缺點(diǎn)也顯而易見(jiàn):它不夠靈活,發(fā)現(xiàn)故障也不夠及時(shí),無(wú)法滿足現(xiàn)在的告警需求。如下圖所示,傳統(tǒng)的閾值告警會(huì)忽略掉兩個(gè)波動(dòng)的異常:

恒定閾值方法

動(dòng)態(tài)閾值的方法在此時(shí)應(yīng)運(yùn)而生,傳統(tǒng)的動(dòng)態(tài)閾值的方法采用了基于同比和環(huán)比的統(tǒng)計(jì)方法,這種方法解釋性強(qiáng),易于實(shí)現(xiàn),但是靈活性較差,受節(jié)假日影響較大(如下圖中,9月24號(hào)為中秋節(jié),流量和上周相比下降明顯,此時(shí)環(huán)比和同比的方法不適用),發(fā)現(xiàn)問(wèn)題也不夠及時(shí)。

還有許多公司采用帶權(quán)移動(dòng)平均的方法來(lái)做動(dòng)態(tài)閾值,他們認(rèn)為在同一個(gè)維度下,某一個(gè)點(diǎn)的數(shù)值必然和它之前一段時(shí)間的數(shù)據(jù)有關(guān),如以下公式所示:

9/18-9/25指標(biāo)數(shù)據(jù)圖

我們目前正將機(jī)器學(xué)習(xí)應(yīng)用在時(shí)序數(shù)據(jù)異常檢測(cè)中,和上述方法相比,機(jī)器學(xué)習(xí)的方法更為準(zhǔn)確,成本也更大。

時(shí)間序列異常檢測(cè)本質(zhì)上也可以看做“正常”和“異常”的二分類問(wèn)題,通過(guò)將歷史的監(jiān)控?cái)?shù)據(jù)打上標(biāo)簽,再將有監(jiān)督和無(wú)監(jiān)督算法結(jié)合建立模型,可以判斷當(dāng)前的時(shí)間序列是否是正常的。

如何用機(jī)器學(xué)習(xí)解決數(shù)據(jù)庫(kù)運(yùn)維難題

二、根因分析

大多數(shù)情況下,由于監(jiān)控指標(biāo)的相關(guān)聯(lián)性,如果某個(gè)指標(biāo)異常了,很多相關(guān)指標(biāo)也會(huì)異常。如果同時(shí)對(duì)所有的告警指標(biāo)進(jìn)行分析和處理,會(huì)浪費(fèi)許多人力。為了解決這個(gè)問(wèn)題,我們需要進(jìn)行根因分析來(lái)進(jìn)行針對(duì)性處理。

通常我們可以通過(guò)下列3種方法對(duì)數(shù)據(jù)進(jìn)行根因分析:

相關(guān)度指標(biāo)獲取,找到和異常指標(biāo)在特定時(shí)間段內(nèi)相似的指標(biāo)。

在大量的樣本中,找出經(jīng)常一起出現(xiàn)的異常指標(biāo)(該問(wèn)題就轉(zhuǎn)換成了頻繁序列挖掘問(wèn)題),實(shí)現(xiàn)方法有關(guān)聯(lián)規(guī)則、APRIORI、FP_GROTH等。

利用決策樹(shù)的強(qiáng)可解釋性,對(duì)正負(fù)樣本進(jìn)行分類,然后通過(guò)異常指標(biāo)的分類樹(shù)途徑,找到頻繁的異常指標(biāo)集。

以O(shè)racle數(shù)據(jù)庫(kù)的DB_TIME偏高為例:

第一種方法找出當(dāng)前時(shí)間段內(nèi)與DB_TIME指標(biāo)有相似曲線的指標(biāo),并將最相似指標(biāo)TOP N作為根因;

第二種方法則是在歷史數(shù)據(jù)中,當(dāng)DB_TIME異常時(shí),把其他異常的指標(biāo)組成若干個(gè)項(xiàng)集,再?gòu)倪@些項(xiàng)集里面利用關(guān)聯(lián)規(guī)則找出強(qiáng)相關(guān)組合,則這些組合中的其他指標(biāo)被視為根因;

第三種方法,則是在歷史數(shù)據(jù)中根據(jù)DB_TIME是否異常,將歷史數(shù)據(jù)分為正、負(fù)樣本,訓(xùn)練決策樹(shù)模型得到最終的根因。

如何用機(jī)器學(xué)習(xí)解決數(shù)據(jù)庫(kù)運(yùn)維難題

根因分析方法一

如何用機(jī)器學(xué)習(xí)解決數(shù)據(jù)庫(kù)運(yùn)維難題

根因分析方法二

根因分析方法三

三、告警收斂

當(dāng)監(jiān)控業(yè)務(wù)發(fā)展到一定規(guī)模時(shí),每日收到的告警郵件數(shù)會(huì)呈指數(shù)型增長(zhǎng),尤其是一些監(jiān)控頻率較高的監(jiān)控項(xiàng)出現(xiàn)問(wèn)題時(shí),這種情況特別明顯。

為了解決這一問(wèn)題,在最開(kāi)始,我們?cè)O(shè)定了告警頻率,讓同一種告警在一段時(shí)間內(nèi)只出現(xiàn)一次。

這種方法確實(shí)會(huì)減少一部分告警,但是還有一些顯而易見(jiàn)的告警可以通過(guò)制定規(guī)則的方法來(lái)實(shí)現(xiàn)進(jìn)一步的告警收斂。比如同一個(gè)集群內(nèi)的數(shù)據(jù)庫(kù)都出現(xiàn)了ping不通的問(wèn)題,又比如同一個(gè)網(wǎng)段內(nèi)的所有IP流量突增,就可以將這些告警整合后再發(fā)送。

而在AIOps時(shí)代,告警收斂和根因分析往往是一起進(jìn)行的。

和根因分析方法二類似,我們可以先獲取告警項(xiàng)集數(shù)據(jù),并提取頻繁項(xiàng)。如果在頻繁告警項(xiàng)集中,告警A和告警B經(jīng)常一起出現(xiàn)并且在A出現(xiàn)的時(shí)間比B早,則在郵件告警中,我們可以忽略B告警,只將A告警推送給運(yùn)維人員。

不同場(chǎng)景下的告警收斂有著不同的需求,和AIOps相比,傳統(tǒng)的告警收斂方法更加簡(jiǎn)單和高效,基于規(guī)則的方法也具有很強(qiáng)的拓展性和解釋性;而AIOps卻能挖掘出我們利用常識(shí)和經(jīng)驗(yàn)無(wú)法發(fā)現(xiàn)的關(guān)聯(lián)項(xiàng)并進(jìn)行告警收斂。

四、容量預(yù)測(cè)

容量預(yù)測(cè)在數(shù)據(jù)庫(kù)運(yùn)維中的很多地方都應(yīng)用著,不同的應(yīng)用場(chǎng)景有不同的特性,我們很難找到一個(gè)模型去適應(yīng)所有的數(shù)據(jù)。

在容量預(yù)測(cè)上,我們的典型應(yīng)用是數(shù)據(jù)庫(kù)DB_SIZE容量預(yù)測(cè),數(shù)據(jù)庫(kù)容量具有總體上升、無(wú)規(guī)律、波動(dòng)大的特點(diǎn)。對(duì)數(shù)據(jù)庫(kù)容量進(jìn)行合理的預(yù)測(cè),短期可以提前發(fā)現(xiàn)可能的故障,進(jìn)行主動(dòng)預(yù)防和提前解決,無(wú)需在問(wèn)題發(fā)生時(shí)被動(dòng)處理;長(zhǎng)期可以進(jìn)行合理的容量規(guī)劃和資源分配。

最開(kāi)始,我們想到的是線性回歸加上簡(jiǎn)單的數(shù)據(jù)預(yù)處理,但是結(jié)果十分不理想。由于業(yè)務(wù)規(guī)模的落差,不同數(shù)據(jù)庫(kù)的容量有著很大的差別,并且在數(shù)據(jù)庫(kù)進(jìn)行導(dǎo)表,擴(kuò)容等操作時(shí),線性擬合或者非線性擬合的效果不盡人意。

顯然,傳統(tǒng)的線性回歸方法雖然簡(jiǎn)單,但是預(yù)測(cè)效果較差,不能滿足要求。為了解決這一問(wèn)題,我們將容量數(shù)據(jù)進(jìn)行了分類,分為周期型和突升突降型,分類的方法可以采用統(tǒng)計(jì)方法,也可以使用聚類或分類的方法。

對(duì)于周期型數(shù)據(jù),我們可以認(rèn)為其實(shí)線性可擬合的,因?yàn)樵诳傮w上升的趨勢(shì)上,周期型的數(shù)據(jù)在周期內(nèi)的增長(zhǎng)值是線性遞增的。對(duì)于這種類型的數(shù)據(jù),我們可以采用線性回歸的機(jī)器學(xué)習(xí)方法來(lái)對(duì)數(shù)據(jù)庫(kù)容量進(jìn)行預(yù)測(cè)。

周期型數(shù)據(jù)

而對(duì)于突增突降型的數(shù)據(jù),線性擬合效果較差,這時(shí)我們使用環(huán)比增量求和的方法,求得歷史數(shù)據(jù)中星期一到星期天的具體每天增量的加權(quán)平均值;再將這個(gè)增量應(yīng)用到預(yù)測(cè)中。和單純的線性擬合方法相比,這種方法的準(zhǔn)確性提高了很多,平均預(yù)測(cè)數(shù)據(jù)的均方殘差縮小了近一倍。

突升突降型數(shù)據(jù)

以上四個(gè)應(yīng)用場(chǎng)景的技術(shù)開(kāi)拓都是致力于通過(guò)AI讓運(yùn)維更加高效,讓更多的故障可以被提前發(fā)現(xiàn)和解決。關(guān)于AIOps,我們還有很多東西可以去嘗試和探索,如智能問(wèn)答機(jī)器人、日志集中分析平臺(tái)等,后續(xù)有相關(guān)成果再與大家分享。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    何用labview顯示數(shù)據(jù)庫(kù)的表格內(nèi)容

    何用labview顯示數(shù)據(jù)庫(kù)的表格內(nèi)容?謝謝
    發(fā)表于 05-16 10:27

    請(qǐng)教如何用SQL語(yǔ)句來(lái)壓縮ACCESS數(shù)據(jù)庫(kù)

    通過(guò)對(duì)ACCESS數(shù)據(jù)庫(kù)的“修復(fù)與壓縮”會(huì)使程序的運(yùn)行更加穩(wěn)定和提高運(yùn)行速度。——請(qǐng)教如何用SQL語(yǔ)句來(lái)壓縮ACCESS數(shù)據(jù)庫(kù),只用SQL語(yǔ)句喲!謝謝!
    發(fā)表于 11-29 21:54

    何用labview創(chuàng)建SQLite數(shù)據(jù)庫(kù)

    何用labview創(chuàng)建SQLite數(shù)據(jù)庫(kù),謝謝
    發(fā)表于 01-22 17:19

    請(qǐng)問(wèn)查詢sql數(shù)據(jù)庫(kù)的表格結(jié)果都是升序排列的,如何用降序排列?二數(shù)組排列也只能升序?

    本帖最后由 一只耳朵怪 于 2018-5-25 10:46 編輯 求教 查詢sql數(shù)據(jù)庫(kù) 的表格結(jié)果都是升序排列的 如何用降序排列 二數(shù)組排列也只能升序
    發(fā)表于 05-25 10:36

    學(xué)習(xí)Linux運(yùn)發(fā)展方向

    發(fā)布等工作需求,如果公司較小的話,可能還會(huì)兼職一下網(wǎng)管、網(wǎng)絡(luò)工程師、數(shù)據(jù)庫(kù)管理員、安全工程師、技術(shù)支持等職務(wù)。  那么,涉及到的Linux平臺(tái)上的運(yùn)工具有哪些呢?答曰:Linux系統(tǒng),Linux
    發(fā)表于 07-25 17:15

    跨平臺(tái)嵌入式數(shù)據(jù)庫(kù)EffiProz介紹

    EffiProz:面向.NET程序員的跨平臺(tái)嵌入式數(shù)據(jù)庫(kù) EffiProz:面向.NET程序員的跨平臺(tái)嵌入式數(shù)據(jù)庫(kù)EffiProz:面向.NET程序員的跨平臺(tái)嵌入式數(shù)據(jù)庫(kù)作者 Jonathan Allen 譯者 張龍 發(fā)布于 2
    發(fā)表于 12-21 06:00

    ADO 控件訪問(wèn)數(shù)據(jù)庫(kù)的各種技巧探討

    本文講述了使用ADO 控件訪問(wèn)數(shù)據(jù)庫(kù)時(shí)如何用程序來(lái)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的連接和數(shù)據(jù)感知控件與數(shù)據(jù)庫(kù)的綁定、如何實(shí)現(xiàn)動(dòng)態(tài)查詢和動(dòng)作查詢以及如
    發(fā)表于 06-10 14:35 ?31次下載

    數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是什么意思

    數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是什么意思 數(shù)據(jù)是當(dāng)今信息社會(huì)的一種極為重要的資源,人們的一切活動(dòng)都離不開(kāi)數(shù)據(jù)。如學(xué)校中的學(xué)生檔案、學(xué)習(xí)成績(jī)記錄、學(xué)
    發(fā)表于 03-18 15:05 ?5258次閱讀

    SQL Server數(shù)據(jù)庫(kù)學(xué)習(xí)總結(jié)

    經(jīng)過(guò)一段時(shí)間的學(xué)習(xí),也對(duì)數(shù)據(jù)庫(kù)有了一些認(rèn)識(shí)。數(shù)據(jù)庫(kù)基本是由表,關(guān)系,操作組成;對(duì)于初學(xué)者首先要學(xué)的:1.數(shù)據(jù)庫(kù)是如何存儲(chǔ)數(shù)據(jù)的.表,約束,觸
    發(fā)表于 11-28 17:36 ?4810次閱讀
    SQL Server<b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>學(xué)習(xí)</b>總結(jié)

    MySQL數(shù)據(jù)庫(kù)誤刪后的回復(fù)技巧

    在日常運(yùn)工作中,對(duì)于數(shù)據(jù)庫(kù)的備份是至關(guān)重要的!數(shù)據(jù)庫(kù)對(duì)于網(wǎng)站的重要性使得我們對(duì) MySQL 數(shù)據(jù)庫(kù)的管理不容有失!然而是人總難免會(huì)犯錯(cuò)誤,
    發(fā)表于 05-05 08:02 ?2468次閱讀
    MySQL<b class='flag-5'>數(shù)據(jù)庫(kù)</b>誤刪后的回復(fù)技巧

    數(shù)據(jù)庫(kù)學(xué)習(xí)教程之數(shù)據(jù)庫(kù)的發(fā)展?fàn)顩r如何數(shù)據(jù)庫(kù)有什么新發(fā)展

    本文檔的主要內(nèi)容詳細(xì)介紹的是數(shù)據(jù)庫(kù)學(xué)習(xí)教程之數(shù)據(jù)庫(kù)的發(fā)展?fàn)顩r如何數(shù)據(jù)庫(kù)有什么新發(fā)展主要內(nèi)容包括了:1 數(shù)據(jù)庫(kù)技術(shù)發(fā)展概述2
    發(fā)表于 10-25 16:29 ?5次下載
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>學(xué)習(xí)</b>教程之<b class='flag-5'>數(shù)據(jù)庫(kù)</b>的發(fā)展?fàn)顩r如何<b class='flag-5'>數(shù)據(jù)庫(kù)</b>有什么新發(fā)展

    數(shù)據(jù)庫(kù)系統(tǒng)的常見(jiàn)用戶

    數(shù)據(jù)庫(kù)管理員(DatabaseAdministrator,簡(jiǎn)稱DBA),是從事管理和維護(hù)數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)的相關(guān)工作人員的統(tǒng)稱,屬于運(yùn)工程師的一個(gè)分支,主要負(fù)責(zé)業(yè)務(wù)
    的頭像 發(fā)表于 02-22 16:28 ?9638次閱讀

    面向機(jī)器學(xué)習(xí)的高可用、高并發(fā)數(shù)據(jù)庫(kù):OpenMLDB

      機(jī)器學(xué)習(xí)應(yīng)用從開(kāi)發(fā)到上線全流程(MLOps)  OpenMLDB 是一個(gè)開(kāi)源機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù),提供線上線下一致的特征平臺(tái)
    發(fā)表于 03-31 15:43 ?0次下載

    python有什么用 如何用python創(chuàng)建數(shù)據(jù)庫(kù)

    開(kāi)發(fā)、游戲開(kāi)發(fā)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等領(lǐng)域。 在本文中,我們將介紹如何使用Python創(chuàng)建數(shù)據(jù)庫(kù)。首先,讓我們了解一下什么是數(shù)據(jù)庫(kù)。 什么是數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 08-28 16:41 ?1516次閱讀

    企業(yè)上云后還需要數(shù)據(jù)庫(kù)運(yùn)嗎?真實(shí)答案看過(guò)來(lái)!

    企業(yè)上云后還需要數(shù)據(jù)庫(kù)運(yùn)嗎?企業(yè)上云后,數(shù)據(jù)庫(kù)運(yùn)仍然是必不可少的。盡管云計(jì)算帶來(lái)了許多便利和
    的頭像 發(fā)表于 11-08 10:02 ?390次閱讀