網(wǎng)絡(luò)的微博話(huà)題發(fā)現(xiàn)
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
針對(duì)微博的實(shí)時(shí)性、稀疏性和海量性特點(diǎn),提出基于實(shí)時(shí)詞共現(xiàn)網(wǎng)絡(luò)的話(huà)題發(fā)現(xiàn)模型。首先,從原始語(yǔ)料中篩選出主題詞集合,再利用時(shí)間參數(shù)計(jì)算共現(xiàn)主題詞的關(guān)系權(quán)重以實(shí)現(xiàn)詞共現(xiàn)網(wǎng)絡(luò)的構(gòu)建,通過(guò)該網(wǎng)絡(luò)推算出與話(huà)題關(guān)聯(lián)性強(qiáng)的潛在特征詞以解決微博特征詞的稀疏性;其次,采用改進(jìn)Single-Pass算法實(shí)現(xiàn)話(huà)題增量聚類(lèi);最后,對(duì)每個(gè)話(huà)題的主題詞按熱度計(jì)算進(jìn)行排序,獲得最具代表性的話(huà)題主題詞。實(shí)驗(yàn)結(jié)果表明,該模型與經(jīng)典Single-Pass聚類(lèi)算法相比,話(huà)題發(fā)現(xiàn)準(zhǔn)確率約提高6%,綜合指標(biāo)提高8%。實(shí)驗(yàn)結(jié)果證明所提模型的有效性和準(zhǔn)確性。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
網(wǎng)絡(luò)的微博話(huà)題發(fā)現(xiàn)下載
相關(guān)電子資料下載
- 對(duì)新輔助TCHP治療響應(yīng)的HER2+乳腺癌空間蛋白質(zhì)組特征 547
- 使用輪廓分?jǐn)?shù)提升時(shí)間序列聚類(lèi)的表現(xiàn) 316
- 基于K-means聚類(lèi)算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類(lèi)算法 498
- 介紹一種基于分層聚類(lèi)方法的木馬通信行為檢測(cè)模型 1060
- 深度學(xué)習(xí)聚類(lèi)的綜述 780
- 聚類(lèi)分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(二) 679
- 如何在 Python 中安裝和使用頂級(jí)聚類(lèi)算法 415
- 聚類(lèi)分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(一) 638
- 機(jī)器學(xué)習(xí)之分類(lèi)分析與聚類(lèi)分析 3550