女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

KiloGram是一種用于管理文件中的大型n-gram的新算法

倩倩 ? 來源:互聯網分析沙龍 ? 2020-04-03 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,一組研究人員在KiloGram上發表了他們的論文,KiloGram是一種用于管理文件中的大型n-gram的新算法,可以改善機器學習對惡意軟件的檢測能力。新算法比以前的方法快60倍,并且可以處理n = 1024或更高的n-gram。n的大值具有可解釋的惡意軟件分析和簽名生成的其他應用程序。

在KDD 2019網絡安全學習和采礦研討會上發表的論文中,來自馬里蘭大學和網絡安全公司Endgame的研究人員描述了他們的算法,用于在大型文件數據集中查找最頻繁的n-gram。以前的方法在增加n的大小時會在內存和運行時中遇到“指數成本”,而在分析具有數十萬個文件的數據集時,它們的n值將小于8。相比之下,KiloGram算法能夠從數百萬個文件中的5TB數據中提取n-gram,而僅使用9GB的RAM,并且“運行時間不會隨n的增加而增加”。這允許算法為較大的n值提取n-gram,以測試這些n-gram是否為機器學習算法提供了更好的準確性。

一個n-gram是n個項的唯一序列,并且該思想被用于許多機器學習任務中,尤其是自然語言處理(NLP)。在檢測到惡意軟件的情況下,n-gram是來自文件的字節序列,該文件將被分類為惡意軟件或良性文件。惡意軟件檢測的早期工作表明,較大的n-gram(例如n = 15或20)對于訓練檢測系統是理想的,但是現代數據集的大小使得使用大于6的n值太昂貴。由于KiloGram算法可以處理那些較大的值,因此研究團隊能夠測試較大值更好的想法。

該團隊使用可執行文件和Adobe PDF文檔的多個數據集,訓練了Elastic-Net正則化邏輯回歸分類器來檢測惡意軟件;為了進行回歸,輸入特征是使用KiloGram算法提取的n元語法。與文獻中的建議相反,研究人員發現“預測精度不會增加到n = 8以上”。較大的n-gram會產生精度降低的模型;但是,它們具有可解釋性的優點。較小的n-gram產生“黑匣子”模型,而較大的n-gram特征集包含可能對分析人員有意義的字節序列。例如,它們可能代表代碼片段或文本字符串。

研究人員認為,較大的n-gram在回歸模型中使用時不那么精確,因為它們更特定于特定的惡意軟件攻擊。實際上,它們會導致過度擬合。但是,當在諸如Yara之類的簽名模型中使用時,它們的優點是它們的假陽性率低。也就是說,盡管Yara模型可能會錯誤地將更多文件標記為良性文件,但如果它確實表明文件為惡意軟件,則很少有錯。這使得KiloGram算法可用于構建結合了機器學習模型和基于簽名的模型的分層系統。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4706

    瀏覽量

    95158
  • 網絡安全
    +關注

    關注

    11

    文章

    3335

    瀏覽量

    61316
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134394
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    100V15A點煙器N溝道MOS管HC070N10L

    N溝道MOS管(金屬-氧化物-半導體場效應晶體管)是一種電壓控制型器件,依靠N型半導體的電子導電。當柵極電壓超過閾值電壓時,源極與漏極之間形成導電溝道,實現電流導通,具有輸入阻抗高、
    發表于 06-27 17:35

    在 KiCad 添加個 AI 助手是一種什么體驗?

    一種什么體驗? 文章出處:【微信公眾號:KiCad】歡迎添加關注!文章轉載請注明出處。
    的頭像 發表于 05-15 14:28 ?224次閱讀

    基于RK3576開發板的車輛檢測算法

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區管理、交通分析等多種場景,是違停識別、堵車識別、車流統計等多種算法的基石算法
    的頭像 發表于 05-08 17:34 ?879次閱讀
    基于RK3576開發板的車輛檢測<b class='flag-5'>算法</b>

    AcrelCloud - 3200:大型商場預付費管理的革新利器

    、方案概述 在現代商業運營和物業管理大型商場、商業小區以及大集團和大物業面臨著復雜的費用收取和管理難題。安科瑞的 AcrelCloud
    的頭像 發表于 04-14 13:38 ?221次閱讀
    AcrelCloud - 3200:<b class='flag-5'>大型</b>商場預付費<b class='flag-5'>管理</b>的革新利器

    hyper-v 文件,Hyper-V文件管理:高效操作指南

    在日常辦公,我們常常需要對大量文件或數據進行重復性操作,比如批量修改文件名、批量更新數據等。這些任務不僅耗時費力,還容易出錯。幸運的是,批量管理工具的出現為我們提供了
    的頭像 發表于 02-06 10:27 ?686次閱讀
    hyper-v <b class='flag-5'>文件</b>,Hyper-V<b class='flag-5'>文件</b><b class='flag-5'>管理</b>:高效操作指南

    AT6N135、AT6N136 是一種用于單通道的高速光耦合器

    AT6N135、AT6N136 是一種用于單通道的高速光耦合器, 由個 850nm 的 AlGaAs LED 光學耦合到
    發表于 01-13 09:54 ?0次下載

    探討移動設備的緩存文件管理

    ? 本文發表于FAST 2022。 探討 緩存文件管理方法。本文 通過個輕量級的基于機器學習的分類引擎來篩選和個性化管理緩存文件 ,實驗
    的頭像 發表于 11-28 11:50 ?1035次閱讀
    探討移動設備<b class='flag-5'>中</b>的緩存<b class='flag-5'>文件</b><b class='flag-5'>管理</b>

    IBIS文件的Series Model簡介及設計仿真實例

    Model是指一種用于描述電路串聯元件(如電阻、電感、電容等)的模型。這些串聯元件通常用于模擬信號路徑的寄生效應,例如信號線上的電阻、
    的頭像 發表于 11-25 11:29 ?1105次閱讀

    華納云:Chord算法如何管理節點間的聯系?

    Chord算法一種分布式哈希表(DHT)協議,它通過構建個環狀結構來管理節點間的聯系。以下是Chord算法如何
    發表于 11-08 16:03

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?697次閱讀
    <b class='flag-5'>一種</b>基于深度學習的二維拉曼光譜<b class='flag-5'>算法</b>

    一種基于光強度相關反饋的波前整形方法

    基于反饋的波前整形通過散射介質聚焦光是一種成熟的方法。在傳統的基于反饋的波前整形,入射光被分成N個輸入模式,這些模式由空間光調制器(SLM)使用N個段進行調制,每個段具有相同數量和大
    的頭像 發表于 10-27 16:28 ?668次閱讀
    <b class='flag-5'>一種</b>基于光強度相關反饋的波前整形方法

    一種半動態環境的定位方法

    和終身定位方法,以識別非靜態環境的半動態物體,并提出了個通用框架,將主流物體檢測算法與建圖和定位算法集成在起。建圖方法結合物體檢測
    的頭像 發表于 09-30 14:40 ?549次閱讀
    <b class='flag-5'>一種</b>半動態環境<b class='flag-5'>中</b>的定位方法

    JK觸發器是一種什么穩態電路

    JK觸發器是一種具有兩個穩態的數字邏輯電路,廣泛應用于數字電路設計。 引言 在數字電路設計,觸發器是一種非常重要的基本邏輯元件。觸發器可
    的頭像 發表于 08-22 10:39 ?1995次閱讀

    TPM在光伏電站安全生產管理的應用

    在可再生能源日益成為全球能源戰略重心的當下,大型光伏電站以其高效、清潔的特性受到廣泛關注。然而,如何確保這些龐大系統安全、穩定運行,成為業界亟待解決的問題。TPM(全面生產維護)作為一種先進的管理
    的頭像 發表于 07-18 10:15 ?679次閱讀

    邊緣計算網關在智能能源管理系統的應用

    隨著物聯網技術的飛速發展,數據生成和處理的需求呈現爆炸式增長。在大型工業園區,能源管理是確保生產效率和環境可持續性的關鍵因素。邊緣計算網關作為一種位于物聯網設備和云端之間的智能設備,
    的頭像 發表于 07-09 15:52 ?661次閱讀
    邊緣計算網關在智能能源<b class='flag-5'>管理</b>系統<b class='flag-5'>中</b>的應用