女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對話機器人之Sparrow簡介

深度學習自然語言處理 ? 來源:NLP日志 ? 2023-01-11 17:00 ? 次閱讀

1 簡介

DeepMind提出的Sparrow,相對于以往的方法,是一種更加有用,準確并且無害的信息檢索對話機器人

在之前的對話研究中,往往會針對對話的不同方面去設計對應的任務跟模塊,例如知識性,一致性,長期記憶等等,但是Sparrow則不然,它直接根據用戶的用戶的反饋進行學習,這樣能盡可能讓模型對齊真實的用戶行為,而不再需要關注過于瑣碎的諸多對話細節。

95cda8ea-8508-11ed-bfe3-dac502259ad0.png

圖1: Sparrow測試樣例

2 Sparrow

整個流程是通過Sparrow模型根據當前對話生成多個候選回復,讓用戶去判斷那個回復最好,哪些回復違反了預先設置好的規則,基于用戶的反饋去訓練對應的Reward模型,利用訓練好的Reward模型,用強化學習算法再去優化Sparrow的生成結果。

95fcf4ec-8508-11ed-bfe3-dac502259ad0.png

圖2:Sparrow框架

Reward

Sparrow學習的用戶反饋分為兩種,一種用戶判斷對話是否違背某些預設置好的規則,另一種的是從用戶根據當前對話從個候選答案里選擇最合適的一個。這兩種反饋分為對應兩個不同的模型,Rule reward model跟Preference reward model。

對于Rule reward model,首先需要根據任務自定義對應的一些規則,例如判斷機器人是否在回答用戶問題,話題是否變化等等,規則樣例如下圖所示。在具體訓練數據構造時,用戶在給定對話條件下,還會給某個特定規則,讓用戶有意識的引導機器人去違反對應的規則,然后再由用戶評估機器人回復是否違反對應的規則。

之所以采用這種方式是為了更高效的積累到高質量樣本。用構造好的訓練數據訓練對應的分類模型,判斷機器人回復是否違反對應的規則,每個規則對應一個分類模型,彼此獨立。

9828ca52-8508-11ed-bfe3-dac502259ad0.png

圖3:規則示例

對于Preference reward model,在給定當前對話條件下,利用多種方式生成多個候選答案(通過是否引入知識檢索,不同生成模型,不同prompt,不同采樣策略),讓用戶從中選擇最合適的答案。利用這些構造好的數據訓練可以得到對應的分類模型,判斷用戶對于當前回復的傾向。

以下圖為例,共有8個候選答案,其中前四個是不不經過知識檢索直接生成的,后面四個是通過兩個不同的檢索query進行知識檢索,將得到的檢索結果跟當前對話合并再一起后再生成回復的。

985333e6-8508-11ed-bfe3-dac502259ad0.png

圖4: 回復生成流程

Reranking

當上述兩個Reward模型給候選答案生成對應的得分后,通過一個重排機制綜合考慮兩者的得分可以進一步優化對話機器人的性能。

Evidence

前面提及的答案生成是可以通過知識檢索,根據當前上下文生成對應的query,利用Google進行搜索,將得到的結果跟當前對話信息組合,然后再生成對應的回復。之前也寫過一些相關的文章,有興趣可以自行查看文本生成系列之retrieval augmentation(思考篇)。

Reinforcement learning

這里強化學習每一步的狀態是當前的對話上下文,action是具體的token,利用前面提及的rule reward model跟preference reward model來給action打出對應的reward得分,從而優化Sparrow的輸出結果。在強化學習訓練過程中,如果機器人生成的回復reward超過預期的話,就會把當前對話上下文+機器人回復作為新的訓練數據加入到語料中,擴充訓練語料庫。

98a86410-8508-11ed-bfe3-dac502259ad0.png

圖5: 強化學習流程

3 總結

個人認為,Sparrow對話機器人,最大的特色在于直接對用戶的反饋進行學習,那樣就不需要為對話各種瑣碎細節去設計不同的模塊跟任務,把決策權進一步交給模型,讓模型自己去學,而對于那些機器人可能學不好的地方,通過預先定義的規則去構造對應的訓練數據,讓模型自己去補全。By the way, 可以好好期待一波ChatGPT了。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29508

    瀏覽量

    211633

原文標題:對話機器人之Sparrow

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI火爆 對話機器人將成為App之后的新入口?

    Bot即智能對話機器人,被業界定義為后App時代的全新人機交互方式,譬如蘋果Siri,微軟小冰,小i機器人虛擬客服等等。例如,目前用戶可以用Siri打開滴滴叫車,這意味著用戶可以直接通過Bots獲取服務,而不需要進入App。
    發表于 10-26 08:54 ?1529次閱讀

    話機器人顯著提高回款效率,對催收幫助不言而喻。

    據的方向,電話機器人最核心的語音識別,機器人必須在最短時間內識別客戶的關鍵詞,并導入下一級菜單(即作出相應的應答)。在整個對話當中,機器人女聲禮貌溫和、應答自如,完全分辨不出是否人工,
    發表于 03-16 15:48

    智能打電話,機器人哪家比較好 如何選擇合適的電銷機器人

    的智能電銷機器人不是有身體有四肢那種實體存在的機器人,而是一套人工智能程序系統,所謂的人工智能機器人都是靠人工智能程序支撐,機器人只是一個載體而已。 智能打電
    發表于 05-03 13:18

    電銷機器人的優點

    。金融、保險、房地產、汽車等各個行業不同,大數訊機器人所制定的話術也不盡相同。且大數訊智能電話機器人會根據公司的側重點及方向來制定話術,使其更有針對性的來跟客戶對話。使用大數訊智能電話機器人
    發表于 06-12 10:27

    話機器人:電銷行業精準篩選客戶的利器

    工作量巨大的工作,不得不說每天有很大一部分時間需要安排在篩選大量意向客戶身上,而挖掘已有客戶的時間少之又少。 一、精準篩選意向客戶——提高效率智能挑選意向客戶:電話機器人能夠正常的和客戶交流、挑選意向
    發表于 08-21 11:27

    華云天下智能電話機器人有哪些優勢?

    的公司。機器人一樣,只有不斷學習,才能提高它的識別能力。在有限的話術配置下,轉接人工座席就顯得尤為重要。華云天下電話機器人就是不一樣!多數廠商的智能電話機器人僅有一到兩輪
    發表于 08-22 14:44

    機器人簡介

    一.機器人簡介機器人(Robot)是自動執行工作的機器裝置。它既可以接受人類指揮,又可以運行預先編排的程序,也可以根據以人工智能技術制定的原則綱領行動。它的任務是協助或取代人類工作的
    發表于 09-07 06:05

    機器人系統與控制需求簡介

    第二章 機器人系統與控制需求簡介2.1 工業機器人的系統組成機械本體:精密減速機、伺服電機、伺服驅動器、控制系統(核心零部件)控制柜示教盒2.2 機器人本體結構與傳動方式
    發表于 09-08 07:44

    設計一個能自由行走并且可以與人語音對話機器人的設計資料分享

    在我的想象中機器人首先應該能自由的走來走去,然后應該能流利的與主人對話。朝著這個理想,我準備設計一個能自由行走,并且可以與人語音對話機器人。實現的關鍵是讓
    發表于 12-17 06:58

    話機器人是什么?電銷機器人有什么用?有多少電話機器人品牌?

    代替人類工作的電話機器人。?  電話機器人采用了最前沿的深入學習技術,先進的語音識別(ASR)、口語理解(SLU)、對話管理(DM)、自然語言生成(NLG)、文本生成語音(TTS)五種對話
    發表于 07-26 19:35 ?1071次閱讀

    檢索式智能對話機器人開發實戰案例詳細資料分析概述

    本文檔的主要內容詳細介紹的是檢索式智能對話機器人開發實戰案例詳細資料分析概述主要內容包括了:第一個智能聊天機器人,人工智能標記語言AIML,AIML基礎功能拓展進階,AIML框架源碼剖析
    發表于 08-02 17:47 ?16次下載

    外呼對話機器人,自動批量外呼、智能人機對話-漢云

    外呼對話機器人融合傳統呼叫中心通信技術、智能AI等計算機技術,實現自動真人語音外呼,智能人機對話等場景,其目的是幫助座席高效完成外呼任務,為企業降低外呼成本,代替輔助人工快速獲客。  隨著國內呼叫
    的頭像 發表于 01-14 09:25 ?3425次閱讀
    外呼<b class='flag-5'>對話機器人</b>,自動批量外呼、智能人機<b class='flag-5'>對話</b>-漢云

    對話機器人的智能程度判斷方法介紹

    有些對話機器人總讓崩潰,也許是智能級別不夠高。本文,就來一起看看如何判斷一個機器人的智能程度。 ? 隨著智能對話技術的發展,對話機器人越來
    的頭像 發表于 01-06 17:50 ?2731次閱讀

    AI應用全面爆發 對話機器人成熱趨

    近日,艾瑞發布了題為《2021中國對話機器人chatbot行業發展研究》報告(下文簡稱《報告》)。報告針對對話機器人的產品流程、發展歷程、市場規模及應用場景分布進行了行業嵌入式研究分析及梳理,對上
    的頭像 發表于 10-14 09:55 ?1055次閱讀

    對話機器人LaMDA

    來自:NLP日志 提綱1 簡介 2 LaMDA 3 總結 1 簡介 LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的對話機器人,全稱
    的頭像 發表于 01-04 14:49 ?1381次閱讀