基于自表達方法的低秩屬性選擇算法
大小:1.33 MB 人氣: 2018-01-24 需要積分:1
標簽:選擇算法(8913)
高維特征表示物體(或樣本)能準確且多樣化地表現物體的特性。因此,高維度數據經常在機器學習及相關領域中存在,如文本數據、人臉數據和生物信息數據等。但是,高維數據的使用不僅增大了數據存儲空間及增加了運算時間的復雜度,而且在對數據處理過程中容易造成維災難等現象。因此,對高維數據進行屬性約簡以降低數據的維度,從而尋找到具有代表性的低維屬性子集成為機器學習領域的研究熱點。
針對無監督屬性選擇算法無類別信息和未考慮屬性的低秩問題,提出一種基于自表達方法的低秩屬性選擇算法。在損失函數中使用低秩和自表達方法描述屬性間的相關結構,利用K均值聚類算法得到所有樣本的偽類標簽進行屬性選擇,采用稀疏學習方法。一范數參數p控制屬性選擇結果的稀疏性,并通過子空間學習方法使屬性選擇結果達到全局最優。實驗結果表明,與無監督屬性選擇算法相比,該算法在6個公開數據集上均具有較高的分類準確率及穩定性。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%