女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機很快或能翻譯更多語言

fYwA_aiangelclu ? 來源:未知 ? 作者:李建兵 ? 2017-12-05 14:00 ? 次閱讀

來源:科學網

得益于神經網絡——從人腦獲得靈感的計算機算式——的發展,自動化的語言翻譯已經存在了相當長一段時間。但訓練這些網絡需要海量數據:數以千萬計的逐句翻譯,以展示人類如何做這項工作。現在,兩篇新論文表明神經網絡可以在無需平行文本的情況下學習翻譯——這一令人震驚的進展或讓人們獲得許多不同語言的文獻記錄。

“想象一下,你給一個人很多中文書籍和阿拉伯書籍,而且它們沒有任何重疊性,然后一個人需要學習將其從中文翻譯為阿拉伯語。這聽起來似乎不可能,對吧?”其中一項研究的第一作者、西班牙圣西巴提巴斯克國家大學(UPV)計算機專家Mikel Artetxe說,“但我們證明計算機可以做到這一點。”

大多數機器學習——神經網絡和其他從經驗中學習的計算機算式會受到“監督”。計算機會進行推測,然后接收到正確答案,并據此調整相應的過程。在教一臺計算機如何在諸如英語和法語之間進行翻譯時,這種模式會非常有效,因為很多文獻在這兩種語言中同時存在。但它對于罕見的語言,或者是那些沒有很多平行文本的通用語言并不奏效。

這兩篇尚未經過同行評議的新文章均已被提交給明年的國際學習表征會議,它們聚焦了另一種方法:不監督機器學習。一開始,計算機在沒有人類老師告訴它們其推測是否正確的情況下建設雙語詞典。這是因為語言在詞匯結合方面有著很強的相似性。例如,在各種語言中,桌子和椅子的詞匯經常會一起使用。因此,如果計算機將這些共現性像一個城市巨大的公路地圖那樣描繪出來,那么不同語言的地圖就會彼此相似,只不過它們擁有不同的名字。如此一來,計算機就能找出將一個地圖集覆蓋在另一個地圖集上的最佳方法。瞧!一本雙語詞典出現了。

這兩篇文章運用了非常類似的方法,均能在語句層面進行翻譯。它們均使用兩種訓練策略,即回譯和去噪。在回譯中,一種語言中的一句話被粗略地翻譯成另一種語言,然后再被轉譯回最初的語言。如果回譯的語句與最初語句并不相同,那么將對神經網絡進行調整,從而使它們在下一次翻譯得更加準確。去噪類似于回譯,但它不是從一種語言翻譯為另一種語言,然后再轉換為原語言,而是在一個句子中加入噪音(重新編排或是刪除詞匯),并嘗試將其翻譯到原語言中去。這兩種方法相結合教會了網絡更深層次的語言結構。

不過,這兩種技術之間也有些微差異。UPV的系統在訓練過程中進行了更多的回譯。而另一個由位于法國巴黎的臉譜網計算機科學家與其合作者研發的系統,則在翻譯過程中加入了額外的步驟。在將其“解碼”為另一種語言之前,兩套系統都會將一種語言的一個句子編碼為一種更加抽象的表征,但臉譜網的系統驗證了中間的“語言”是真正抽象的。Artetxe和Artetxe均表示,他們可以通過應用對方論文中的技術來改善自己的結果。

在兩篇文章之間進行的唯一直接對比結果中——對摘自同一組約3000萬個語句在英語和法語文本之間進行翻譯,兩套系統在雙向翻譯中均獲得了15分的雙語評估分數(用來衡量翻譯準確性)。這個分值沒有谷歌翻譯高(該系統所用的受監督的方法得分為40分),也不如人類翻譯得分高(超過50分),但卻比逐字翻譯要好得多。作者表示,兩套系統可以很容易地通過變為“半監督性”得到改善,即把數千個平行的語句加入到它們的訓練中。

除了不需要平行文本進行跨語言翻譯之外,Artetxe和Lample均表示,他們的系統有助于進行諸如英語和法語之間的常用翻譯匹配,特別是如果平行文本是同一類的話,如新聞報道。但除此之外,人們還希望將其翻譯為不同類型的文本,如街頭俚語或是醫學術語。“但這一切尚處于新生階段。”Artetxe的共同作者Eneko Agirre說,“我們剛剛開始了一個新的研究大道,現在我們還不知道它會通向哪里。”

中國北京計算機學家、其工作對上述兩項研究產生影響的Di He說:“在沒有人類監督的情況下,計算機能夠學習翻譯,這令人吃驚。”Artetxe說,他的方法和Lample的方法被上傳到arXiv預印本服務平臺的時間前后僅相隔1天,這樣的時間巧合令人吃驚。“同時,它意味著這種方法的確是正確的方向。”


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1805

    文章

    48851

    瀏覽量

    247576

原文標題:人工智能“自學”做翻譯

文章出處:【微信號:aiangelclub,微信公眾號:人工智能天使會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Meta與UNESCO合作推動多語言AI發展

    在數字環境中常被忽視的少數民族語言。 據Meta介紹,這項計劃將積極尋求合作伙伴的加入,共同提供豐富的語言資源。合作伙伴需要貢獻超過10小時的語音錄音及其對應的轉錄內容,同時還需要提供豐富的書面文本以及翻譯句子的集合。這些寶貴的
    的頭像 發表于 02-08 11:04 ?595次閱讀

    微軟Copilot Voice升級,積極拓展多語言支持

    近日,據報道,微軟近期在人工智能領域取得了新的進展,正積極拓展其Copilot Voice的多語言支持功能。這一舉措標志著微軟在語音識別和自然語言處理技術上又邁出了重要一步。 此次Copilot
    的頭像 發表于 02-06 14:10 ?403次閱讀

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向用戶提供按需的計算服務。下面,AI部落小編為
    的頭像 發表于 12-17 10:19 ?524次閱讀

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括
    的頭像 發表于 12-09 11:11 ?932次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    工業中使用哪種計算機

    在工業環境中,工控機被廣泛使用。這些計算機的設計可承受極端溫度、灰塵和振動等惡劣條件。它們比標準消費類計算機更耐用、更可靠。工業計算機可控制機器、監控流程并實時收集數據。其堅固的結構和專業功能
    的頭像 發表于 11-29 14:07 ?653次閱讀
    工業中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區別

    ? 本文介紹了量子計算機與普通計算機工作原理的區別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現在的量子
    的頭像 發表于 11-24 11:00 ?1359次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區別

    C語言數組應用計算機導論A第6講:數組

    C語言數組應用計算機導論A第6講:數組
    發表于 11-20 15:33 ?0次下載

    ChatGPT 的多語言支持特點

    )技術迎來了巨大的挑戰和機遇。ChatGPT,作為一個領先的語言模型,其多語言支持的特點成為了它在眾多應用場景中不可或缺的優勢。 1. 多語言理解能力 ChatGPT 的多語言支持首先
    的頭像 發表于 10-25 17:30 ?1453次閱讀

    科大訊飛發布訊飛星火4.0 Turbo大模型及星火多語言大模型

    ,科大訊飛以其一貫的創新精神,開創性地發布了星火多語言大模型。這一創新之舉不僅進一步鞏固了科大訊飛在中文和英文處理領域的領先地位,更將語言的支持范圍大幅擴展,涵蓋了俄語、日語、阿拉伯語、韓語、法語、西班牙語、葡萄牙語以及
    的頭像 發表于 10-24 13:58 ?853次閱讀

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設備之間以及計算機各部件之間傳輸數據、控制信息和狀態信息的硬件設備和軟件程序。它在計算機系統中
    的頭像 發表于 10-14 14:02 ?1143次閱讀

    計算機存儲系統的構成

    計算機存儲系統是計算機中用于存放程序和數據的設備或部件的集合,它構成了計算機信息處理的基礎。一個完整的計算機存儲系統通常包括多個層次的存儲器,從高速緩存(Cache)到主存儲器(Mai
    的頭像 發表于 09-26 15:25 ?2387次閱讀

    簡述計算機總線的分類

    計算機總線作為計算機系統中連接各個功能部件的公共通信干線,其結構和分類對于理解計算機硬件系統的工作原理至關重要。以下是對計算機總線結構和分類的詳細闡述,內容將涵蓋總線的基本概念、內部結
    的頭像 發表于 08-26 16:23 ?5016次閱讀

    晶體管計算機和電子管計算機有什么區別

    晶體管計算機和電子管計算機作為計算機發展史上的兩個重要階段,它們在多個方面存在顯著的區別。以下是對這兩類計算機在硬件、性能、應用以及技術發展等方面區別的詳細闡述。
    的頭像 發表于 08-23 15:28 ?3461次閱讀

    自然語言處理技術在計算機系統中的應用

    自然語言處理(Natural Language Processing, NLP)作為計算機科學與人工智能領域中的一個重要分支,其目標是讓計算機能夠理解、處理并生成人類語言。隨著科技的進
    的頭像 發表于 07-04 14:35 ?1019次閱讀

    什么是工業計算機(IPC)?

    工業電腦也稱為IPC,其組件專門設計用于工業工作環境。因此,工業計算機特別堅固,基于強大的處理器,可以根據相應的應用進行單獨調整。工業計算機的典型方面:耐惡劣環境(包括灰塵、水、濺水、寒冷、炎熱
    的頭像 發表于 06-24 18:01 ?1546次閱讀
    什么是工業<b class='flag-5'>計算機</b>(IPC)?