顧名思義,“聊天機器人”是與您聊天的機器。訣竅是使它盡可能像人一樣。從“美國運通客戶支持”到Google Pixel的呼叫篩選軟件聊天機器人,各種各樣。
它實際上如何運作?
聊天機器人的早期版本使用一種稱為模式匹配的機器學習技術。與當今使用的高級NLP技術相比,這要簡單得多。
什么是模式匹配?
要理解這一點,請想象您會問一個書商,例如“ __本書的價格是多少?”或“您擁有____本書的哪幾本書?”這些斜體字中的每一個都是可以將來出現(xiàn)類似問題時進行匹配。
模式匹配需要大量預先生成的模式?;谶@些預先生成的模式,聊天機器人可以輕松地選擇與客戶查詢最匹配的模式并為其提供答案。
您不妨猜一下下面的聊天是如何實現(xiàn)的?
簡而言之,可以將我的價格知道的問題轉換為模板《star /》的價格。該模板就像一個密鑰,以后將使用它存儲所有答案。所以我們可以有以下內容
·iPhone X的價格-1500美元
·Kindle Paperwhite的價格-100美元
NLP聊天機器人
模式匹配很容易實現(xiàn),但是只能走得很遠。 它需要許多預先生成的模板,并且僅對期望數(shù)量有限的問題的應用程序有用。
xkcd
輸入NLP! NLP是一些稍先進的技術的集合,可以理解廣泛的問題。創(chuàng)建聊天機器人的NLP過程可以分為5個主要步驟
1)標記化-標記化是一種將文本切成小段的技術,稱為標記,并同時丟棄某些字符,例如標點符號。這些標記在語言上代表文本。
標記句子
2)規(guī)范化-規(guī)范化處理文本以找出可能會改變用戶請求的預期含義的常見拼寫錯誤。一篇對推文進行規(guī)范化的非常好的研究論文很好地解釋了這個概念
推文研究的句法規(guī)范化
3)識別實體-此步驟可幫助聊天機器人識別正在談論的事物,例如是對象還是國家/地區(qū)或數(shù)字還是用戶的地址。 在下面的示例中觀察到Google,IBM和Microsoft是如何組織在一起的。此步驟也稱為命名實體識別。
4)依存關系解析-在這一步中,我們將句子分為其名詞,動詞,賓語,常用短語和標點符號。這項技術可幫助機器識別短語,進而告訴用戶要傳達的內容。
Stanford —依賴項解析示例
5)生成-最后,生成響應的步驟。以上所有步驟都屬于NLU(自然語言理解)。這些步驟可幫助機器人理解所寫句子的含義。但是,此步驟屬于NLG(自然語言生成)。此步驟接收先前NLU步驟的輸出,并生成許多具有相同含義的句子。在以下方面,生成的句子通常相似
·詞序-“廚房燈”類似于“廚房燈”
·單數(shù)/復數(shù)-“廚房燈”類似于“廚房燈”
·問題-“關門”類似于“您介意關門嗎?”
·否定-“在19:00打開電視”類似于“在19:00不打開電視”
·禮貌-“打開電視”類似于“請您能開一個電視好嗎?”
根據(jù)用戶的問題,機器人可以使用上述選項之一進行回復,并且用戶會滿意地返回。在許多情況下,用戶無法區(qū)分機器人和人類。
自1995年AIML發(fā)明以來,聊天機器人一直在穩(wěn)步增長,并取得了長足的發(fā)展。即使在2016年,平均用戶花費超過20分鐘的時間通過消息傳遞應用程序進行交互,其中Kakao,Whatsapp和Line是最受歡迎的。
相似的網(wǎng)絡
世界各地的企業(yè)都在尋求削減客戶服務成本,并通過使用這些漫游器來全天候提供客戶服務。
NLP還有很長的路要走,但是即使在目前的狀態(tài)下,NLP在聊天機器人領域也有很大的希望。
-
機器學習
+關注
關注
66文章
8492瀏覽量
134117 -
聊天機器人
+關注
關注
0文章
348瀏覽量
12712 -
nlp
+關注
關注
1文章
490瀏覽量
22488
發(fā)布評論請先 登錄
評論