女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子論文>數(shù)字信號(hào)處理論文>一種改進(jìn)的句子相似度計(jì)算模型

一種改進(jìn)的句子相似度計(jì)算模型

2008-11-20 | rar | 333 | 次下載 | 2積分

資料介紹

在基于實(shí)例的機(jī)器翻譯中,句子相似度計(jì)算是實(shí)例匹配的有效機(jī)制。該文對(duì)基于相同詞的句子相似模型作進(jìn)一步的改進(jìn),包括關(guān)鍵詞抽取,以及在句子相似度的定義中引入同義詞的情形。實(shí)驗(yàn)結(jié)果表明,改進(jìn)方法比原方法具有較高的準(zhǔn)確率。
關(guān) 鍵 詞 自然語(yǔ)言處理; 基于實(shí)例的機(jī)器翻譯; 句子相似度; 基于詞

基于實(shí)例的機(jī)器翻譯(Example Based Machine Translation,EBMT)是以雙語(yǔ)對(duì)齊的實(shí)例庫(kù)為主要知識(shí)源,輸入一個(gè)待翻譯的源語(yǔ)言句子,從實(shí)例庫(kù)中查找與輸入句最相似的例句,再模仿例句的譯文來(lái)實(shí)現(xiàn)輸入句的翻譯。在EBMT中,實(shí)例匹配是關(guān)鍵,直接關(guān)系到系統(tǒng)本身的翻譯質(zhì)量。實(shí)現(xiàn)實(shí)例匹配的有效機(jī)制是進(jìn)行句子相似度計(jì)算[1-2],目前主要有基于詞[3-5]和基于句法語(yǔ)義分析[6-7]的兩類(lèi)方法。兩類(lèi)方法各有優(yōu)缺點(diǎn),基于詞的方法簡(jiǎn)單、流行,但由于僅利用句子的表層信息,即組成句子的有關(guān)詞匯的詞法和語(yǔ)義信息,因此,在判斷句子整體結(jié)構(gòu)相似方面有欠缺;基于句法語(yǔ)義分析的方法折衷考慮句子的組成詞匯語(yǔ)義信息與整體框架結(jié)構(gòu)信息,但在折衷考慮的層次上較難把握。本文研究基于詞的句子相似度計(jì)算問(wèn)題,并在文獻(xiàn)[5]的基礎(chǔ)上提出了一種改進(jìn)的方法。
1 基于詞的句子相似度計(jì)算
基于詞的方法是目前最簡(jiǎn)單、最流行的方法,依據(jù)詞的形態(tài)變化、同義詞、反義詞以及更進(jìn)一步的語(yǔ)義距離來(lái)判斷孤立詞之間的相似度,再通過(guò)這種詞間相似度的不同組合來(lái)確定句子間的相似度。文獻(xiàn)[3]利用同義詞表計(jì)算兩句詞之間的語(yǔ)義距離,進(jìn)而計(jì)算兩句之間的相似度。文獻(xiàn)[4]通過(guò)正反雙向比較兩句相同詞的個(gè)數(shù)及其位置關(guān)系,得到一個(gè)轉(zhuǎn)換表達(dá)式和子塊庫(kù),再通過(guò)系統(tǒng)預(yù)定義的翻譯模式和限制條件實(shí)現(xiàn)兩句相似度的計(jì)算。文獻(xiàn)[5]通過(guò)比較兩句相同詞的個(gè)數(shù)及其位置關(guān)系,得到兩句的詞形相似度和詞序相似度,再通過(guò)詞形相似度和詞序相似度計(jì)算兩句的相似度。
文獻(xiàn)[4-5]采用的方法實(shí)質(zhì)上是相同的,均通過(guò)比較相同詞的個(gè)數(shù)及其位置關(guān)系來(lái)計(jì)算兩句的相似度。但在相似度的定義中,僅考慮了形態(tài)上相同的詞,而沒(méi)有考慮同義詞的情形。例如,對(duì)兩個(gè)簡(jiǎn)單的句子“我/ 是/ 老師/ 。/”與“他/ 為/ 學(xué)生/。/”,按照文獻(xiàn)[5]中的方法計(jì)算則相似度很低(只有0.1),實(shí)際上這兩句是比較相似的。究其原因,主要是沒(méi)有考慮兩句中的同義詞“是”和“為”。另外,也沒(méi)有考慮任何句法結(jié)構(gòu)信息。因此,在算法實(shí)現(xiàn)上雖然較為簡(jiǎn)單,但準(zhǔn)確率卻不高。基于詞的方法依據(jù)句子的表層信息,通過(guò)對(duì)這些表層信息的加工也可以獲得一些有用的句法結(jié)構(gòu)信息,如抽取一些能夠近似表達(dá)部分句法結(jié)構(gòu)信息的關(guān)鍵性的詞(以下簡(jiǎn)稱(chēng)關(guān)鍵詞)。在此基礎(chǔ)上進(jìn)行句子相似度計(jì)算,就會(huì)具有較高的準(zhǔn)確率。本文針對(duì)以上兩點(diǎn)作了進(jìn)一步的改進(jìn)。
2 一種改進(jìn)的方法
本文對(duì)文獻(xiàn)[5]中的句子相似模型作了進(jìn)一步改進(jìn),包括關(guān)鍵詞抽取,以及在句子相似度的定義中考慮同義詞的情形。令inp為待翻譯的輸入句,exa為對(duì)應(yīng)的m個(gè)例句中的一個(gè),先分別抽取inp和exa中所有的名詞、代詞、動(dòng)詞或形容詞,并組成相應(yīng)的關(guān)鍵詞序列,再求出inp和exa中關(guān)鍵詞序列的相似度,最后選取大于規(guī)定閾值的最大相似度例句作為輸入句的最相似例句。
2.1 關(guān)鍵詞抽取
由語(yǔ)言學(xué)知識(shí)可知,任何句子都是由關(guān)鍵成分(主、謂、賓等)和修飾成分(定、狀、補(bǔ)等)構(gòu)成的。關(guān)鍵成分對(duì)句子起主要作用,修飾成分對(duì)句子起次要作用。進(jìn)行句子相似度計(jì)算時(shí),只要考慮句中的關(guān)鍵成分。基于詞的方法不考慮句法結(jié)構(gòu)分析,因此,不能確定句子的內(nèi)部成分,包括關(guān)鍵成分和修飾成分。在通常情況下,一個(gè)句子中作主語(yǔ)和賓語(yǔ)的多為名詞或代詞,作謂語(yǔ)的多為動(dòng)詞或形容詞。因此,可以將一個(gè)句子中的所有名詞、代詞、動(dòng)詞和形容詞作為關(guān)鍵詞,并在計(jì)算句子相似度時(shí)只考慮這些關(guān)鍵詞。例如,句子“我/ 當(dāng)然/ 愿意/ 了解/ 她們/ 的/ 要求/ 。/”的關(guān)鍵詞序列為 “我/ 愿意/ 了解/ 她們/ 要求/ 。/”。對(duì)于特定句中的某個(gè)名詞、代詞、動(dòng)詞或形容詞,不一定就是該句中的主語(yǔ)、賓語(yǔ)或謂語(yǔ)成分,但相對(duì)于句中所有的詞構(gòu)成的詞序列而言,關(guān)鍵詞序列卻具有一定的句法結(jié)構(gòu)信息表達(dá)能力,至少可以了解句子中的哪些詞在組成句子框架結(jié)構(gòu)方面是比較重要的。在此基礎(chǔ)上進(jìn)行相似度計(jì)算,比一般基于詞的方法準(zhǔn)確一些。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1DC電源插座圖紙
  2. 0.67 MB   |  2次下載  |  免費(fèi)
  3. 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
  4. 1.51MB   |  2次下載  |  免費(fèi)
  5. 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
  6. 2.07MB   |  1次下載  |  免費(fèi)
  7. 4AN111-LTC3219用戶(hù)指南
  8. 84.32KB   |  次下載  |  免費(fèi)
  9. 5AN153-用于電源系統(tǒng)管理的Linduino
  10. 1.38MB   |  次下載  |  免費(fèi)
  11. 6AN-283: Σ-Δ型ADC和DAC[中文版]
  12. 677.86KB   |  次下載  |  免費(fèi)
  13. 7SM2018E 支持可控硅調(diào)光線(xiàn)性恒流控制芯片
  14. 402.24 KB  |  次下載  |  免費(fèi)
  15. 8AN-1308: 電流檢測(cè)放大器共模階躍響應(yīng)
  16. 545.42KB   |  次下載  |  免費(fèi)

本月

  1. 1ADI高性能電源管理解決方案
  2. 2.43 MB   |  450次下載  |  免費(fèi)
  3. 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
  4. 5.67 MB   |  138次下載  |  1 積分
  5. 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
  6. 0.10 MB   |  130次下載  |  免費(fèi)
  7. 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
  8. 2.96 MB   |  44次下載  |  免費(fèi)
  9. 53314A函數(shù)發(fā)生器維修手冊(cè)
  10. 16.30 MB   |  31次下載  |  免費(fèi)
  11. 6美的電磁爐維修手冊(cè)大全
  12. 1.56 MB   |  24次下載  |  5 積分
  13. 7如何正確測(cè)試電源的紋波
  14. 0.36 MB   |  17次下載  |  免費(fèi)
  15. 8感應(yīng)筆電路圖
  16. 0.06 MB   |  10次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935121次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420062次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233088次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191367次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183335次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81581次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73810次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65988次下載  |  10 積分