資料介紹
研究了當前幾種時興的頻集挖掘算法(Apriori,DF,FP-growth 和DCI)及其技術特點,并對其分類和界定適用范圍。對其算法復雜性及時空執行效率等性能指標進行了定性和定量的綜合分析。研究的結果對于在各種應用環境下的
關聯挖掘系統的設計具有參考價值。
關鍵詞: 頻集挖掘; Apriori; DF; FP-growth; DCI
種頻集挖掘算法及其特點
2.1 Apriori 算法
A priori算法是目前最為著名也是應用最為廣泛的一種算法,并且目前許多算法都是在A priori的基礎上優化和改進而來的。A priori算法核心思想是:首先掃描一遍數據庫D ,產生頻繁1 項集L 1,然后產生頻繁2 項集L 2,直到有某個r 值使得L r 為空,這時算法停止。在第k 次循環過程中,首先產生候選k-項集的集合C k,C k 中的每一個項集是對2 個只有一個項不同的屬于L k-1 的頻集做一個(k - 2) 連接產生的。C k 是用來產生頻集的候選集,為了決定C k 中的元素是否頻繁,必須掃描數據庫D 計算其支持度,因此頻集L k 是C k 的一個子集[1]。C k 中的每個元素需進行驗證來決定其是否加入L k ,這里的驗證過程是算法性能的一個瓶頸。A priori算法的不足之處在于:1)可能產生大量的候選集。例如,當長度為1 的頻集有104 個的時候,長度為2 的候選集個數將會超過107;2)如果要生成一個很長的規則時,要產生的中間元素也是巨量的。
2.2 DF 算法
D F 算法其實是A priori的一種改進算法,最重要的區別在于其采用了深度優先的方法,這也正是其稱之為D F(D epth F irst)的原因。D F 算法采用了層次樹(trie)來存儲頻繁項集。因為任何一個頻繁集的子集也是頻繁的,所以trie 很適合用來存儲頻繁項集。D F 算法執行如下操作[2]:掃描一遍數據庫;計算各個項的支持度;并將頻繁項按支持度排序;在主存中建立trie,trie 從根到葉子的每一條路徑代表一個唯一的頻繁項集;最后,算法輸出trie 中的所有路徑,即所有的頻繁項集。
關聯挖掘系統的設計具有參考價值。
關鍵詞: 頻集挖掘; Apriori; DF; FP-growth; DCI
種頻集挖掘算法及其特點
2.1 Apriori 算法
A priori算法是目前最為著名也是應用最為廣泛的一種算法,并且目前許多算法都是在A priori的基礎上優化和改進而來的。A priori算法核心思想是:首先掃描一遍數據庫D ,產生頻繁1 項集L 1,然后產生頻繁2 項集L 2,直到有某個r 值使得L r 為空,這時算法停止。在第k 次循環過程中,首先產生候選k-項集的集合C k,C k 中的每一個項集是對2 個只有一個項不同的屬于L k-1 的頻集做一個(k - 2) 連接產生的。C k 是用來產生頻集的候選集,為了決定C k 中的元素是否頻繁,必須掃描數據庫D 計算其支持度,因此頻集L k 是C k 的一個子集[1]。C k 中的每個元素需進行驗證來決定其是否加入L k ,這里的驗證過程是算法性能的一個瓶頸。A priori算法的不足之處在于:1)可能產生大量的候選集。例如,當長度為1 的頻集有104 個的時候,長度為2 的候選集個數將會超過107;2)如果要生成一個很長的規則時,要產生的中間元素也是巨量的。
2.2 DF 算法
D F 算法其實是A priori的一種改進算法,最重要的區別在于其采用了深度優先的方法,這也正是其稱之為D F(D epth F irst)的原因。D F 算法采用了層次樹(trie)來存儲頻繁項集。因為任何一個頻繁集的子集也是頻繁的,所以trie 很適合用來存儲頻繁項集。D F 算法執行如下操作[2]:掃描一遍數據庫;計算各個項的支持度;并將頻繁項按支持度排序;在主存中建立trie,trie 從根到葉子的每一條路徑代表一個唯一的頻繁項集;最后,算法輸出trie 中的所有路徑,即所有的頻繁項集。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 權重模糊粗糙集的改進規則挖掘算法 4次下載
- 數據挖掘原理與算法 5次下載
- 如何使用閾值自適應憶阻器Hopfield神經網絡進行關聯規則挖掘算法 5次下載
- 如何使用DiffNodeset結構進行最大頻繁項集挖掘算法概述 6次下載
- 頻繁項集高效挖掘算法研究劉芝怡 0次下載
- 基于MapReduce和矩陣的頻繁項集挖掘算法 4次下載
- 數據挖掘Apriori算法的改進 17次下載
- 時興頻集挖掘算法的辨析
- 分類規則挖掘算法綜述
- 基于矩陣偽投影策略的頻繁項集挖掘方法
- 基于集合枚舉樹的最小預測集挖掘算法
- 基于灰色關聯分析的孤立點挖掘算法
- 一種新的模糊加權關聯規則挖掘算法
- 基于矩陣的關聯規則挖掘算法
- 水平分布數據集的隱私保護關聯挖掘算法
- 基于Python實現隨機森林算法 1232次閱讀
- 一文弄懂數據挖掘的十大算法,數據挖掘算法原理講解 1138次閱讀
- middlebury數據集是什么 2262次閱讀
- 代碼實例及詳細資料帶你入門Python數據挖掘與機器學習 3387次閱讀
- 數據挖掘算法:決策樹算法如何學習及分裂剪枝 5814次閱讀
- 從五個方面讓你了解人工智能算法中的Apriori 2389次閱讀
- 十大經典數據挖掘算法—Apriori 3758次閱讀
- 數據挖掘Apriori算法報告 5236次閱讀
- 關聯規則挖掘——Apriori算法的基本原理以及改進 9439次閱讀
- Apriori算法詳解 2.1w次閱讀
- Matlab關于Apriori算法設計 5150次閱讀
- 簡介Apriori算法并解析該算法的具體策略和步驟,給出Python實現代碼 5853次閱讀
- 怎么學習數據挖掘_如何系統地學習數據挖掘 4802次閱讀
- 什么叫數據挖掘_數據挖掘技術解析 1.9w次閱讀
- 基于GT4的聚類分析算法研究 1023次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數發生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論