一種融合知網(wǎng)和搜索引擎的詞匯語義相似度計算方法
大小:0.82 MB 人氣: 2017-12-04 需要積分:1
標簽:相似度(2673)
針對當前《知網(wǎng)》的詞語語義描述與人們對詞匯的主觀認知之間存在諸多不匹配的問題,在充分利用豐富的網(wǎng)絡知識的背景下,提出了一種融合《知網(wǎng)》和搜索引擎的詞匯語義相似度計算方法。首先,考慮了詞語與詞語義原之間的包含關系,利用改進的概念相似度計算方法得到初步的詞語語義相似度結果;然后,利用基于搜索引擎的相關性雙重檢測算法和點互信息法得出進一步的語義相似度結果;最后,設計了擬合函數(shù)并利用批量梯度下降法學習權值參數(shù),融合前兩步的相似度計算結果。實驗結果表明,與單純的基于《知網(wǎng)》和基于搜索引擎的改進方法相比,融合方法的斯皮爾曼系數(shù)和皮爾遜系數(shù)均提升了5%,同時提升了具體詞語義描述與人們對詞匯的主觀認知之間的匹配度,驗證了將網(wǎng)絡知識背景融入到概念相似度計算方法中能有效提高中文詞匯語義相似度的計算性能。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%