短文本聚類算法
大小:0.78 MB 人氣: 2017-11-17 需要積分:0
標簽:聚類算法(12092)
針對短文本特征極度稀疏、上下文依賴性強等特點,以自頂向下的策略,提出一種基于核心詞項平均劃分相似度的短文本聚類算法CTMPS。該方法首先在整個短文本語料庫中計算詞項之間的概率相關性,以此為基礎對短文本中詞項進行加權,將權值較大的詞項作為最能代表該短文本的核心詞項形成核心詞項集;以信息論為基礎,將核心詞項作為劃分依據計算平均劃分相似度,選擇平均劃分相似度值最大包含該核心詞項的短文本形成一類,用此策略反復迭代直到滿足要求。最后,實驗結果表明,本文提出的方法顯著地提高了短文本聚類的性能。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
短文本聚類算法下載
相關電子資料下載
- 基于K-means聚類算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類算法 498
- 如何在 Python 中安裝和使用頂級聚類算法 415
- 10種聚類算法和Python代碼4 1118
- 10種聚類算法和Python代碼3 960
- 10種聚類算法和Python代碼2 796
- 10種聚類算法和Python代碼1 644
- YOLOv5中的autoanchor.py代碼解析 1242
- 視覺新范式!COCs:將圖像視為點集 636
- 10種頂流聚類算法Python實現(附完整代碼) 989