資料介紹
一種改進(jìn)的基于粗糙集理論的特征選取方法_王作飛
文本分類是文本挖掘的重要組成部分。通過該技術(shù)可以自 動(dòng)地為文檔集合中的每篇文檔確定類別, 并對(duì)它們進(jìn)行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實(shí)際應(yīng)用價(jià)值。文本分類一般分為訓(xùn)練和分類 階段,在分類階段,文本集經(jīng)過文本預(yù)處理后得到特征集。但是 特征集仍然是個(gè)高維的特征空間, 對(duì)于所有的分類算法來說維 數(shù)都太大。因此,選擇一個(gè)合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務(wù)和 關(guān)鍵。 目前,常用的特征選擇算法一般是先構(gòu)建一個(gè)評(píng)估函數(shù),對(duì) 特征集中的每個(gè)特征獨(dú)立地進(jìn)行評(píng)估每個(gè)特征獲得一個(gè)評(píng)估 值,然后根據(jù)評(píng)估值對(duì)特征進(jìn)行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個(gè)最佳特征主要針對(duì)某一個(gè)具 體的問題通過實(shí)驗(yàn)來決定。現(xiàn)在這樣的評(píng)估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計(jì)法等。 作為一種處理含糊和不精確問題的新型數(shù)學(xué)工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢(shì)。針對(duì)以往基于粗糙集理論中正區(qū)域約簡(jiǎn)特征選取在處理不 一致決策表時(shí)存在的不足,本文通過過引入粒度函數(shù)的概念,并 以此為基礎(chǔ)采用粗糙集啟發(fā)式屬性約簡(jiǎn)方法實(shí)現(xiàn)了特征在分 類中的重要性度量標(biāo)定和約簡(jiǎn), 使原來的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準(zhǔn)確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應(yīng)性強(qiáng)。最后用實(shí)驗(yàn)驗(yàn)證了該方法的可行
文本分類是文本挖掘的重要組成部分。通過該技術(shù)可以自 動(dòng)地為文檔集合中的每篇文檔確定類別, 并對(duì)它們進(jìn)行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實(shí)際應(yīng)用價(jià)值。文本分類一般分為訓(xùn)練和分類 階段,在分類階段,文本集經(jīng)過文本預(yù)處理后得到特征集。但是 特征集仍然是個(gè)高維的特征空間, 對(duì)于所有的分類算法來說維 數(shù)都太大。因此,選擇一個(gè)合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務(wù)和 關(guān)鍵。 目前,常用的特征選擇算法一般是先構(gòu)建一個(gè)評(píng)估函數(shù),對(duì) 特征集中的每個(gè)特征獨(dú)立地進(jìn)行評(píng)估每個(gè)特征獲得一個(gè)評(píng)估 值,然后根據(jù)評(píng)估值對(duì)特征進(jìn)行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個(gè)最佳特征主要針對(duì)某一個(gè)具 體的問題通過實(shí)驗(yàn)來決定。現(xiàn)在這樣的評(píng)估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計(jì)法等。 作為一種處理含糊和不精確問題的新型數(shù)學(xué)工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢(shì)。針對(duì)以往基于粗糙集理論中正區(qū)域約簡(jiǎn)特征選取在處理不 一致決策表時(shí)存在的不足,本文通過過引入粒度函數(shù)的概念,并 以此為基礎(chǔ)采用粗糙集啟發(fā)式屬性約簡(jiǎn)方法實(shí)現(xiàn)了特征在分 類中的重要性度量標(biāo)定和約簡(jiǎn), 使原來的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準(zhǔn)確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應(yīng)性強(qiáng)。最后用實(shí)驗(yàn)驗(yàn)證了該方法的可行
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 權(quán)重模糊粗糙集的改進(jìn)規(guī)則挖掘算法 4次下載
- 程度多粒度軟粗糙集模型綜述 1次下載
- 一種基于粗糙集聚類的報(bào)文格式推斷方法 3次下載
- 一種統(tǒng)計(jì)粗糙集模型 0次下載
- 一種改進(jìn)的變精度粗糙集漏洞威脅評(píng)估模型 0次下載
- 粗糙集理論的數(shù)據(jù)挖掘方法在水泥生產(chǎn)分解爐中的應(yīng)用_王夙娟 0次下載
- 粗糙集方法在紅外圖像增強(qiáng)中的應(yīng)用
- 基于粗糙集理論的網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)
- 基于粗糙集理論的空氣質(zhì)量智能數(shù)據(jù)分析
- 基于粗糙集規(guī)則提取算法的研究及應(yīng)用
- 基于遺傳算法的誤差因子粗糙集模型
- 基于粗糙集的啟發(fā)式約簡(jiǎn)算法
- 基于概率粗糙集模型的信息檢索
- 基于粗糙集理論的除氧系統(tǒng)智能控制器設(shè)計(jì)
- 基于粗糙集理論的入侵檢測(cè)方法研究
- 一種簡(jiǎn)單高效配置FPGA的方法 745次閱讀
- 一種完全分布式的點(diǎn)線協(xié)同視覺慣性導(dǎo)航系統(tǒng) 469次閱讀
- 電源濾波電容如何選取? 3097次閱讀
- FLAT的一種改進(jìn)方案 1779次閱讀
- 基于改進(jìn)FCOS的鋼帶表面缺陷檢測(cè)算法 1692次閱讀
- 一種基于DSP+FPGA結(jié)構(gòu)的通用飛控計(jì)算機(jī)設(shè)計(jì)方法介紹 2453次閱讀
- 人工智能是一種改進(jìn)數(shù)據(jù)控制和處理的方法 3165次閱讀
- 研究人員提出了一種多尺度高效率的新模型FAMED-Net 3911次閱讀
- OpenAI提出了一種回報(bào)設(shè)置方法RND 3202次閱讀
- 一種自動(dòng)生成反向傳播方程的方法 3857次閱讀
- 【新專利介紹】一種改進(jìn)電表 1314次閱讀
- 基于激光誘導(dǎo)超塑性的卷對(duì)卷工藝制程是一種新的制造方法 5152次閱讀
- 一種新的基于電穿孔的皮膚高效核酸遞送方法 5187次閱讀
- 基于特征模理論和CMA技術(shù)的天線設(shè)計(jì) 9819次閱讀
- 一種matlab調(diào)用signaltap采集數(shù)據(jù)的方法 3949次閱讀
下載排行
本周
- 1TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開關(guān)電源基礎(chǔ)知識(shí)
- 5.73 MB | 11次下載 | 免費(fèi)
- 3嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 4DIY動(dòng)手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的C8051F單片機(jī)開發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 651單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191186次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論