女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺談機器學習中的異常檢測應用

中科院長春光機所 ? 來源:極市平臺 ? 作者:極市平臺 ? 2020-10-29 11:26 ? 次閱讀

一、簡介

異常檢測一直是機器學習中一個非常重要的子分支,在各種人工智能落地應用例如計算機視覺、數據挖掘、NLP中,異常檢測算法都是很熱門的研究方向,特別是大數據時代,人工處理數據的速度已經遠遠趕不上機器了,所以更快地檢測數據中的異常情況成為了我們當下非常重要的任務。在深度學習廣泛的推廣之前,傳統的異常檢測算法有很多,例如高斯擬合,半監督學習等等,而在深度學習大火之后,人們也開始研究將深度學習應用于各種異常任務中(也就是Deep Anomaly Detection,以下統稱DAD),并取得了很大的成功,本文將把當下該方向熱門的研究方向分類并列舉了對應的文章,希望能幫助大家更好地理解此方向的研究。

二、異常檢測的概念

異常檢測,從定義而言就是一種識別不正常情況與挖掘非邏輯數據的技術,也叫outliers。例如在計算機視覺的應用中,有人在抖音發表一個視屏,在邊騎車邊打電話,那這就是個不符合規范的視屏,我們能否采用一些方式來將其檢測出來,再例如在數據挖掘領域中,那異常檢測的應用就更廣泛了,比如信用卡盜刷,超大金額支出等等。通常情況下,在我們閱讀論文的過程中,異常檢測(Anomaly Detection)也被叫做,Novelty Detection,Outlier Detection,Forgery Detection,Out-of-distribution Detection。在閱讀論文的情況,這些名詞也有輕微的區別,以計算機視覺為例,如下圖所示。

在計算機視覺的基本任務——圖像分類中,單分類與多分類問題,將幾種概念的細微區別基本闡述清楚了。Anomaly Detection指在不屬于該分類的數據集中,而Novelty是檢測可能屬于該分類但卻沒見過(Unseen)也就是Novel的數據集,而OOD(out-of-distribution)則是多分類中不同目標的分布,這些任務在接下來的論文中,也經常有人進行相應的研究。

三、異常檢測相關工作與方向

首先根據查閱異常檢測方向綜述的文章,我將基于深度學習的異常檢測應用方向論文,按照主要的邏輯結構列舉在了下面,我相信這可以更加方便地向你展示異常檢測方向你應該怎樣去研究你的論文。

1. DAD研究的主要元素

(1) 異常數據集

點集

連續集

團隊集

(2) 異常檢測模型

無監督學習、AutoEncoder、GAN、矩陣因子分解

半監督學習、強化學習

Hybrid(混種)、特征提取+傳統算法

單分類神經網絡

(3) 異常檢測應用

詐騙檢測

網絡侵入檢測

醫學異常檢測

傳感器網絡異常檢測

視屏監督

物聯網大數據異常檢測

日志異常檢測

工業危害檢測

2. 異常檢測論文分類

下面也是我根據參考文獻,把異常檢測論文分成幾個當前研究方向,相當于列出了一個目錄在這里,可供之后方便查看,關于論文分類的一些概念,我會在下面的介紹中詳細提及。

(1) 數據的連續性

(2) 數據標簽的可用性

監督學習Supervised Learning

半監督學習Semi-supervised Learning

無監督學習Unsupervised Learning

(3) 基于訓練對象的模型

深度混種模型Deep Hybrid Model(DHM)

單分類神經網絡One-Class Neural Networks(OC-NN)

(4) 數據異常類型

點集Point

連續集Contextual

團隊集Collective or Group

(5) 異常檢測輸出類型

異常分數Anomaly Score

標簽Lable

(6) 異常檢測應用

有將近十種異常檢測相關的應用,由于目前對該部分研究較淺,所以之后會考慮單獨寫篇文章來總結異常檢測方面的應用型論文。

四、原始數據的連續性Nature of Input Data

在DAD問題中選擇怎樣的網絡結構很大部分取自于原始數據(raw/input data)的類型,原始數據在廣義上我們可以分為連續型(Sequential)與非連續型(Non-sequential),如何選擇相應的模型,我列舉在下表中。

原始數據類型 舉例 DAD模型選擇
連續型Sequential 視屏,DNA序列,自然語言文本 CNN,RNN,LSTM
非連續型Non-sequential 圖片,傳感器 CNN,AE及其變種

DAD在未降維的高維原始數據中表現優異,成功提取大規模數據的關系,通常情況下,網絡越深,提取效果越好,這個部分感興趣的話可以參考下面這篇文章。

Yann LeCun, Yoshua Bengio, and Geoffrey Hinton. Deep learning. nature, 521(7553):436, 2015.

五、數據標簽的可用性Availability of Labels

數據標簽是非常重要的事情,標簽代表著正常(normal)數據或是未見過(unseen/novel)的數據,對于標簽內容的使用同樣是現在異常檢測方向論文重點考慮的事情。異常檢測的模型也可以根據數據標簽的內容廣義的分為三類,監督,半監督和無監督。

1. 監督Supervised DAD

基于監督學習的DAD文章,整理了兩篇醫學方向的,由于監督學習對于標簽內容的依賴度過重,所以他對于異常檢測的問題并不是那么合適,所以它并不如半監督和無監督應用地那么廣泛。

Raghavendra Chalapathy, Ehsan Zare Borzeshi, and Massimo Piccardi. An investigation of recurrent neural architectures for drug name recognition. arXiv preprint arXiv:1609.07585, 2016a.

Raghavendra Chalapathy, Ehsan Zare Borzeshi, and Massimo Piccardi. Bidirectional lstm-crf for clinical concept extraction. arXiv preprint arXiv:1611.08373, 2016b.

2. 半監督Semi-supervised DAD

由于正常數據集比異常數據集更好獲得,所以半監督學習DAD方法被非常廣泛的使用,擁有了足夠的數據集,我們能更好地標出正常數據,異常數據,新數據的界限,半監督學習模型列舉三篇論文。

Drausin Wulsin, Justin Blanco, Ram Mani, and Brian Litt. Semi-supervised anomaly detection for eeg waveforms using deep belief nets. In Machine Learning and Applications (ICMLA), 2010 Ninth International Conference on, pages 436–441. IEEE, 2010.

Mutahir Nadeem, Ochaun Marshall, Sarbjit Singh, Xing Fang, and Xiaohong Yuan. Semi-supervised deep neural network for network intrusion detection. 2016.

Hongchao Song, Zhuqing Jiang, Aidong Men, and Bo Yang. A hybrid semi-supervised anomaly detection model for high-dimensional data. Computational intelligence and neuroscience, 2017.

3. 無監督Unsupervised DAD

傳統機器學習算法其實我感覺更傾向于直接從數據集中讓機器去學習一些東西,然后直接用參數的方式表示出來,異常檢測問題同樣我們也用自動標簽的方式去檢測是否異常,因為有時候可能數據難以獲取。自動解碼器是無監督DAD的核心,所以這里深度學習的一些神經網絡大有可為,例如RNN,LSTM等等。我們這里只列舉了一種采用變種半監督學習方法的論文,應用于異常數據降維,表現效果超越很多傳統降維算法,如PCA,Isolation等等。

Aaron Tuor, Samuel Kaplan, Brian Hutchinson, Nicole Nichols, and Sean Robinson. Deep learning for unsupervised insider threat detection in structured cybersecurity data streams. arXiv preprint arXiv:1710.00811, 2017.

六、基于訓練對象的模型

按照訓練對象的區別,我們把訓練模型單獨劃分為兩類,變種模型與單分類神經網絡。

1. 深度變種模型Deep Hybrid Models(DHM)

Jerone TA Andrews, Edward J Morton, and Lewis D Griffin. Detecting anomalous data using auto-encoders. International Journal of Machine Learning and Computing, 6(1):21, 2016a.

Tolga Ergen, Ali Hassan Mirza, and Suleyman Serdar Kozat. Unsupervised and semi-supervised anomaly detection with lstm neural networks. arXiv preprint arXiv:1710.09207, 2017.

2. 單分類神經網絡One-Class Neural Networks(OC-NN)

Raghavendra Chalapathy, Aditya Krishna Menon, and Sanjay Chawla. Anomaly detection using one-class neural networks. arXiv preprint arXiv:1802.06360, 2018a.

七、數據異常類型

1. 點集Point

舉信用卡盜刷的例子,點集異常就是指單筆交易大金額支出,比如你都花1塊2塊的錢,突然有一天消費了1k,那可能就出現了異常情況,但這個方向好像沒有人單獨發過文章。

2. 連續集Contextual or Conditional

連續集就是指上下文相關的連續數據,某一個中間數據出現了異常情況,可能引起了梯度消失爆炸等等問題。

Xiuyao Song, Mingxi Wu, Christopher Jermaine, and Sanjay Ranka. Conditional anomaly detection. IEEE Transactions on Knowledge and Data Engineering, 19(5):631–645, 2007.

3. 團隊集Collective or Group

還是信用卡盜刷的例子,如果某天你的信用卡突然短時間內不停地消費50元,那機器可能會發現,這些團隊數據集的消費出現了異常,這種情況我們也在其他場合經常遇到。

Raghavendra Chalapathy, Edward Toth, and Sanjay Chawla. Group anomaly detection using deep generative models. arXiv preprint arXiv:1804.04876, 2018b.

Lo¨?c Bontemps, James McDermott, Nhien-An Le-Khac, et al. Collective anomaly detection based on long short-term memory recurrent neural networks. In International Conference on Future Data and Security Engineering, pages 141–152. Springer, 2016.

Daniel B Araya, Katarina Grolinger, Hany F ElYamany, Miriam AM Capretz, and G Bitsuamlak. Collective contextual anomaly detection framework for smart buildings. In Neural Networks (IJCNN), 2016 International Joint Conference on, pages 511–518. IEEE, 2016.

Naifan Zhuang, Tuoerhongjiang Yusufu, Jun Ye, and Kien A Hua. Group activity recognition with differential recurrent convolutional neural networks. In Automatic Face & Gesture Recognition (FG 2017), 2017 12th IEEE International Conference on, pages 526–531. IEEE, 2017.

八、idea新穎的論文

這里我再給大家推薦8篇idea比較新穎的論文,可供大家閱讀與交流。

[1] Liu W, Luo W, Lian D, et al. Future frame prediction for anomaly detection–a new baseline[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6536-6545.

[2] Gong D, Liu L, Le V, et al. Memorizing normality to detect anomaly: Memory-augmented deep autoencoder for unsupervised anomaly detection[C]//Proceedings of the IEEE International Conference on Computer Vision. 2019: 1705-1714.

[3] Park H, Noh J, Ham B. Learning Memory-guided Normality for Anomaly Detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 14372-14381.

[4] Zhao Y, Deng B, Shen C, et al. Spatio-temporal autoencoder for video anomaly detection[C]//Proceedings of the 25th ACM international conference on Multimedia. 2017: 1933-1941.

[5] Ionescu R T, Khan F S, Georgescu M I, et al. Object-centric auto-encoders and dummy anomalies for abnormal event detection in video[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 7842-7851.

[6] Liu W, Luo W, Li Z, et al. Margin Learning Embedded Prediction for Video Anomaly Detection with A Few Anomalies[C]//IJCAI. 2019: 3023-3030.

[7] Sultani W, Chen C, Shah M. Real-world anomaly detection in surveillance videos[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6479-6488.

[8] Luo W, Liu W, Gao S. A revisit of sparse coding based anomaly detection in stacked rnn framework[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 341-349.

九、最后總結

最后給大家推薦一個超級nice的github倉庫,里面的文章都比較新,并且也進行了一些分類。

https://github.com/hoya012/awesome-anomaly-detection

文章轉自“極市平臺”

責任編輯:PSY

原文標題:異常檢測(Anomaly Detection)綜述

文章出處:【微信公眾號:中科院長春光機所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 異常檢測
    +關注

    關注

    1

    文章

    43

    瀏覽量

    9809
  • 人工智能
    +關注

    關注

    1804

    文章

    48599

    瀏覽量

    246006
  • 機器學習
    +關注

    關注

    66

    文章

    8487

    瀏覽量

    133994

原文標題:異常檢測(Anomaly Detection)綜述

文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    基于深度學習對運維時序指標進行異常檢測,快速發現線上業務問題 時間序列的異常檢測是實際應用的一
    的頭像 發表于 05-22 16:38 ?255次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>篇)

    如何設計基于AI的異常檢測解決方案

    汽車制造部門一直致力于在提高產品質量和最小化運營費用之間實現平衡。基于 AI 的異常檢測是一種識別機器數據的不規則模式以在潛在問題發生前預測這些問題的方法,它是對提高流程效率、減少停
    的頭像 發表于 03-20 15:26 ?391次閱讀

    zeta在機器學習的應用 zeta的優缺點分析

    在探討ZETA在機器學習的應用以及ZETA的優缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發表于 12-20 09:11 ?826次閱讀

    cmp在機器學習的作用 如何使用cmp進行數據對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習的作用 模型
    的頭像 發表于 12-17 09:35 ?725次閱讀

    eda在機器學習的應用

    機器學習項目中,數據預處理和理解是成功構建模型的關鍵。探索性數據分析(EDA)是這一過程不可或缺的一部分。 1. 數據清洗 數據清洗 是機器學習
    的頭像 發表于 11-13 10:42 ?730次閱讀

    魯棒性在機器學習的重要性

    機器學習領域,模型的魯棒性是指模型在面對輸入數據的擾動、異常值、噪聲或對抗性攻擊時,仍能保持性能的能力。隨著人工智能技術的快速發展,機器學習
    的頭像 發表于 11-11 10:19 ?1070次閱讀

    基于機器學習的IWR6843AOP跌倒和姿態檢測實現

    電子發燒友網站提供《基于機器學習的IWR6843AOP跌倒和姿態檢測實現.pdf》資料免費下載
    發表于 09-03 10:02 ?2次下載
    基于<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的IWR6843AOP跌倒和姿態<b class='flag-5'>檢測</b>實現

    機器視覺在焊接質量檢測的應用

    的可能性。今天跟隨創想智控小編一起了解機器視覺在焊接質量檢測的應用。 1. 機器視覺原理 機器視覺是一種利用計算機技術對圖像進行分析和處理
    的頭像 發表于 08-13 16:33 ?528次閱讀

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    如何通過根因分析技術獲得導致故障的維度和元素,包括基于時間序列異常檢測算法的根因分析、基于熵的根因分析、基于樹模型的根因分析、規則學習等。 ●第7章“智能運維的應用場景”:介紹智能運維領域的應用,包括
    發表于 08-07 23:03

    機器學習的數據分割方法

    機器學習,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發表于 07-10 16:10 ?2891次閱讀

    深度學習在工業機器視覺檢測的應用

    隨著深度學習技術的快速發展,其在工業機器視覺檢測的應用日益廣泛,并展現出巨大的潛力。工業機器視覺檢測
    的頭像 發表于 07-08 10:40 ?1682次閱讀

    深度學習在視覺檢測的應用

    深度學習機器學習領域中的一個重要分支,其核心在于通過構建具有多層次的神經網絡模型,使計算機能夠從大量數據自動學習并提取特征,進而實現對復
    的頭像 發表于 07-08 10:27 ?1140次閱讀

    機器學習在數據分析的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器
    的頭像 發表于 07-02 11:22 ?1210次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發表于 07-01 11:40 ?2168次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    應用,將理論基礎與實踐案例相結合,作者憑借扎實的數學功底及其在企業界的豐富實踐經驗,將機器學習與時間序列分析巧妙融合在書中。 全書書共分為8章,系統介紹時間序列的基礎知識、常用預測方法、異常
    發表于 06-25 15:00