女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP的兩個部分:NLU和NLG

GKwL_infoqchina ? 來源:InfoQ ? 2019-12-12 14:18 ? 次閱讀

比爾·蓋茨曾說過,「語言理解是人工智能皇冠上的明珠」。自然語言處理的進(jìn)步將會推動人工智能整體進(jìn)展。NLP 的歷史幾乎跟計算機(jī)和人工智能的歷史一樣長。自計算機(jī)誕生,就開始有了對人工智能的研究,而人工智能領(lǐng)域最早的研究就是機(jī)器翻譯以及自然語言理解。

隨著大數(shù)據(jù)和技術(shù)設(shè)施的完善,人工智能技術(shù)在近年來迎來了井噴式的發(fā)展。在產(chǎn)業(yè)方面,不少專注于計算機(jī)視覺的公司也獲得了長足發(fā)展。其中比較具有代表性的是估值已經(jīng)超過 20 億美元的商湯科技,在經(jīng)歷了數(shù)輪大額融資之后,其隱隱有從獨角獸變成巨頭的趨勢。

不過,人工智能另一個相關(guān)領(lǐng)域自然語言處理似乎沒有達(dá)到這種高度。在技術(shù)方面,這一領(lǐng)域的技術(shù)準(zhǔn)確率遠(yuǎn)遠(yuǎn)沒有達(dá)到計算機(jī)視覺和語音識別的水平,技術(shù)產(chǎn)品也因為較高的錯誤率,缺少實際價值。那么 NLP 技術(shù)到底有哪些難點呢?

什么是 NLP?

在人工智能出現(xiàn)之前,計算機(jī)只能處理結(jié)構(gòu)化的數(shù)據(jù),就比如我們平時用的表格里的數(shù)據(jù),但是網(wǎng)絡(luò)中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,比如我們看到的文章、圖片、視頻等等。在這些數(shù)據(jù)中,文本數(shù)據(jù)又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術(shù),讓機(jī)器理解這些文本信息,并加以利用。

人類可以通過語言來交流,而為了讓計算機(jī)之間互相交流,人們讓所有計算機(jī)都遵守一些規(guī)則,計算機(jī)的這些規(guī)則就是計算機(jī)之間的語言。自然語言處理(NLP)就是在機(jī)器語言和人類語言之間溝通的橋梁,以實現(xiàn)人機(jī)交流的目的。

NLP 的兩個部分:NLU 和 NLG

自然語言理解(NLU) 則是 NLP 的一部分,這幾年深度學(xué)習(xí)技術(shù)的發(fā)展使 NLU 能在一些場景中落地。自然語言理解就是希望機(jī)器像人一樣,具備正常人的語言理解能力,由于自然語言在理解上有很多難點 (下面詳細(xì)說明),所以 NLU 是至今還遠(yuǎn)不如人類的表現(xiàn)。

NLU 目前應(yīng)用的領(lǐng)域主要集中在機(jī)器翻譯、機(jī)器客服、智能音箱等領(lǐng)域,但由于需要大量的數(shù)據(jù)訓(xùn)練和 NLU 本身存在的一些語言語義上的難點,其實機(jī)器還不是非常智能。

自然語言生成(NLG)是 NLP 的重要組成部分,NLU 負(fù)責(zé)理解內(nèi)容,NLG 負(fù)責(zé)生成內(nèi)容。他的主要目的是降低人類和機(jī)器之間的溝通鴻溝,將非語言格式的數(shù)據(jù)轉(zhuǎn)換成人類可以理解的語言格式。

自然語言生成 – NLG 有 2 種方式:

text – to – text:文本到語言的生成

data – to – text :數(shù)據(jù)到語言的生成

NLP 的難點

對于機(jī)器來說,難點主要分為 5 類問題:

語言的多樣性,我們?nèi)粘K玫恼Z言是沒有規(guī)律的,不同的組合可以表達(dá)出很多的含義。

語言的歧義性,如果不聯(lián)系上下文,缺少環(huán)境的約束,語言有很大的歧義性

語言是一個開放集合,我們可以任意的發(fā)明創(chuàng)造一些新的表達(dá)方式。

語言需要知識依賴,需要聯(lián)系到實踐知識。

語言的上下文

應(yīng)用場景復(fù)雜,很難出現(xiàn)“獨角獸”

總的來說,NLP 技術(shù)領(lǐng)域之所以沒有出現(xiàn)如計算機(jī)視覺領(lǐng)域那些獨角獸公司,是因為自然語言處理的技術(shù)難度太大,和應(yīng)用場景太復(fù)雜。一個公司的成立發(fā)展都是由需求驅(qū)動的,自然語言應(yīng)用主要是機(jī)器翻譯,雖然機(jī)器翻譯的需求長期存在,但機(jī)器翻譯的水平一直未取得突破性的進(jìn)展,即使到今天,機(jī)器也很難翻譯有背景的復(fù)雜句子。

另外,自然語言處理的應(yīng)用太依賴于UI了。圖像識別基本不需要 UI,直接在系統(tǒng)內(nèi)部集成一些技術(shù)就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗不行,人們就不會愿意使用。

技術(shù)產(chǎn)業(yè)化最重要的是商業(yè)模式,也就是怎么讓技術(shù)掙錢。圖像識別公司的掙錢模式已經(jīng)成立了,但翻譯付費就難多了。所以自然語言是從研究到技術(shù)到落地到商業(yè)化,面臨一系列的挑戰(zhàn)。目前的現(xiàn)狀是,自然語言處理技術(shù)更多的是作為公司內(nèi)部技術(shù),比如內(nèi)部的商業(yè)情報或人機(jī)接口功能。

NLP 技術(shù)發(fā)展,未來可期

從今年的 ACL 大會可以看出 NLP 技術(shù)的火爆。會議共收到了 2900 余篇提交的論文,投稿規(guī)模相較于 2018 年增長了 75%!自然語言處理領(lǐng)域?qū)嵲谑侵耸挚蔁幔瑢W(xué)術(shù)界和工業(yè)界的熱情都創(chuàng)下了歷史新高。

從商業(yè)層面來講也涌現(xiàn)出了微軟小冰、小米小愛等比較成熟的機(jī)器人產(chǎn)品,相信在未來的不久 NLP 技術(shù)一定會給我們帶來更多的驚喜。

大咖現(xiàn)場分享 NLP 技術(shù)干貨

王斌博士,是小米人工智能實驗室主任,NLP 首席科學(xué)家。中國中文信息學(xué)會理事,計算語言學(xué)、信息檢索、社會媒體處理、語言與知識計算等專委會委員及《中文信息學(xué)報》編委,中國計算機(jī)學(xué)會中文信息處理專業(yè)委員會委員。

加入小米之前,他在中科院計算所、信工所從事自然語言處理和信息檢索相關(guān)的科研工作。在AICon 全球人工智能與機(jī)器學(xué)習(xí)大會現(xiàn)場,他將會帶來 NLP 技術(shù)方面的相關(guān)演講,各位感興趣的小伙伴歡迎來現(xiàn)場聽他分享。

AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會,將于 11 月 21-22 日在北京國際會議中心舉行。顏水成、賈揚清、崔寶秋等 AI 技術(shù)大咖屆時也會來現(xiàn)場,跟大家聊一聊今年在 AI 商業(yè)化場景落地的大背景下,又涌現(xiàn)出了哪些新技術(shù)。本次大會我們設(shè)立了機(jī)器學(xué)習(xí)、計算機(jī)視覺、NLP、AI芯片、搜索推薦、產(chǎn)業(yè)互聯(lián)網(wǎng)、硅谷 AI 技術(shù)實踐等 13+ 技術(shù)專場,細(xì)分到 AI 技術(shù)的各個領(lǐng)域,為大家全方位的展示 AI 技術(shù)在國內(nèi)目前發(fā)展的現(xiàn)狀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48677

    瀏覽量

    246343
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1706

    瀏覽量

    46561
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22476

原文標(biāo)題:為何NLP領(lǐng)域難以出現(xiàn)“獨角獸”?丨AICon

文章出處:【微信號:infoqchina,微信公眾號:InfoQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    ADS7230有兩個電源和兩個地,是不是意味著芯片內(nèi)部模擬部分和數(shù)字部分是隔離的?

    ADS7230有兩個電源和兩個地,是不是意味著芯片內(nèi)部模擬部分和數(shù)字部分是隔離的?或者是非隔離,只做電平轉(zhuǎn)換的?忘各位大俠解答,小弟不甚感激!?。?
    發(fā)表于 01-08 08:21

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎?

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎,驅(qū)動程序中怎么分別讀兩個模擬輸入的轉(zhuǎn)換結(jié)果?
    發(fā)表于 12-02 08:02

    兩個開關(guān)電源可以并聯(lián)使用嗎

    兩個開關(guān)電源并聯(lián)使用是一相對復(fù)雜的話題,涉及到電子電路設(shè)計、電源管理、安全規(guī)范等多個方面。 1. 開關(guān)電源的基本原理 開關(guān)電源是一種通過電子開關(guān)元件(如晶體管、MOSFET等)快速切換來控制電流
    的頭像 發(fā)表于 10-09 16:04 ?4055次閱讀

    單相電機(jī)兩個繞組都在定子上嗎

    定子和一轉(zhuǎn)子組成。定子是電機(jī)的固定部分,而轉(zhuǎn)子是旋轉(zhuǎn)部分。在單相電機(jī)中,定子通常包含一主繞組和一輔助繞組,這
    的頭像 發(fā)表于 09-03 15:10 ?1862次閱讀

    ad如何設(shè)置兩個元器件的距離

    在Altium Designer(簡稱AD)中設(shè)置兩個元器件之間的距離,主要是通過設(shè)置元器件間的安全間距(Clearance)規(guī)則來實現(xiàn)的。這個規(guī)則定義了元器件之間、元器件與走線之間以及其他設(shè)計元素
    的頭像 發(fā)表于 09-02 15:31 ?1.5w次閱讀

    功放機(jī)AB兩個聲道輸出怎么接

    功放機(jī)AB兩個聲道輸出的接線方式,主要取決于您想要實現(xiàn)的音頻效果以及音箱的配置。以下將詳細(xì)介紹幾種常見的接線方式,以及它們各自的特點和適用場景。 一、基礎(chǔ)接線方式 在大多數(shù)情況下,功放機(jī)的AB兩個
    的頭像 發(fā)表于 08-23 10:40 ?7922次閱讀

    觸發(fā)器的兩個穩(wěn)定狀態(tài)分別是什么

    觸發(fā)器作為數(shù)字電路中的基本邏輯單元,具有兩個穩(wěn)定狀態(tài),這兩個狀態(tài)通常用于表示二進(jìn)制數(shù)碼中的0和1。
    的頭像 發(fā)表于 08-12 11:01 ?2636次閱讀

    雙穩(wěn)態(tài)電路的兩個穩(wěn)定狀態(tài)是什么

    雙穩(wěn)態(tài)電路是一種具有兩個穩(wěn)定狀態(tài)的電子電路,廣泛應(yīng)用于數(shù)字電路、通信系統(tǒng)、存儲器等領(lǐng)域。 雙穩(wěn)態(tài)電路的基本概念 雙穩(wěn)態(tài)電路是一種具有兩個穩(wěn)定狀態(tài)的電路,即在沒有外部輸入信號的情況下,電路可以保持在
    的頭像 發(fā)表于 08-11 15:00 ?2397次閱讀

    雙穩(wěn)態(tài)觸發(fā)器的兩個基本性質(zhì)是什么

    的定義 雙穩(wěn)態(tài)觸發(fā)器是一種具有兩個穩(wěn)定狀態(tài)的邏輯電路,通常由兩個交叉耦合的反相器或門電路構(gòu)成。在沒有外部輸入信號的情況下,雙穩(wěn)態(tài)觸發(fā)器可以保持在兩個穩(wěn)定狀態(tài)之一,即“0”狀態(tài)或“1”狀態(tài)。 1.2 雙穩(wěn)態(tài)觸發(fā)器的組成 雙穩(wěn)態(tài)觸發(fā)
    的頭像 發(fā)表于 08-11 10:08 ?1198次閱讀

    兩個路由器ip地址沖突怎么解決

    當(dāng)兩個路由器的IP地址發(fā)生沖突時,會導(dǎo)致網(wǎng)絡(luò)連接不穩(wěn)定或無法連接。以下是解決兩個路由器IP地址沖突的步驟: 確定沖突的IP地址 首先,需要確定兩個路由器的IP地址是否沖突??梢酝ㄟ^以下方法來檢查
    的頭像 發(fā)表于 07-09 11:35 ?9163次閱讀

    nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

    來改變我們的行為和情感。NLP的目標(biāo)是幫助人們實現(xiàn)自我改進(jìn),提高溝通技巧,增強(qiáng)領(lǐng)導(dǎo)力和解決問題的能力。 NLP的主要組成部分包括: 感知:了解我們?nèi)绾谓邮蘸吞幚硇畔ⅰ?語言:研究我們?nèi)绾问褂谜Z言來表達(dá)我們的思想和情感。 編程:研
    的頭像 發(fā)表于 07-09 10:35 ?1093次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    深度學(xué)習(xí)和自然語言處理(NLP)是計算機(jī)科學(xué)領(lǐng)域中兩個非常重要的研究方向。它們之間既有聯(lián)系,也有區(qū)別。本文將介紹深度學(xué)習(xí)與NLP的區(qū)別。 深度學(xué)習(xí)簡介 深度學(xué)習(xí)是一種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法
    的頭像 發(fā)表于 07-05 09:47 ?1483次閱讀

    NLP模型中RNN與CNN的選擇

    在自然語言處理(NLP)領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)與卷積神經(jīng)網(wǎng)絡(luò)(CNN)是種極為重要且廣泛應(yīng)用的網(wǎng)絡(luò)結(jié)構(gòu)。它們各自具有獨特的優(yōu)勢,適用于處理不同類型的NLP任務(wù)。本文旨在深入探討RNN與CNN
    的頭像 發(fā)表于 07-03 15:59 ?950次閱讀

    交流二元繼電器有哪兩個線圈

    交流二元繼電器是一種常見的電氣元件,廣泛應(yīng)用于各種電氣控制系統(tǒng)中。它主要由兩個線圈組成,這兩個線圈分別是線圈1和線圈2。下面我們將詳細(xì)介紹這兩個線圈的特點、工作原理以及在實際應(yīng)用中的注意事項。 一
    的頭像 發(fā)表于 06-29 09:43 ?1172次閱讀

    兩個PLC之間如何交互信號

    在工業(yè)自動化系統(tǒng)中,PLC(Programmable Logic Controller,可編程邏輯控制器)是核心的控制設(shè)備。在許多復(fù)雜的應(yīng)用場景中,需要兩個或多個PLC之間進(jìn)行信號交互,以實現(xiàn)更高
    的頭像 發(fā)表于 06-14 16:57 ?6531次閱讀