近日,微軟沈向洋等人發(fā)表論文《微軟小冰的設(shè)計(jì)與實(shí)現(xiàn)》,幾乎無保留地公開了小冰系統(tǒng)的開發(fā)過程,詳述了系統(tǒng)架構(gòu)和關(guān)鍵組件,包括對話管理器、核心聊天、技能和移情計(jì)算模塊。
社交聊天機(jī)器人,或能夠與人類進(jìn)行共情對話的智能系統(tǒng)的開發(fā),一直是人工智能領(lǐng)域持續(xù)時間最長的目標(biāo)之一。近年來,隨著大量會話數(shù)據(jù)的出現(xiàn),以及機(jī)器學(xué)習(xí)的突破被應(yīng)用于會話AI,對話智能系統(tǒng)在學(xué)術(shù)研究界和行業(yè)中都取得了可喜的成果。
微軟小冰是世界上最流行的社交聊天機(jī)器人之一。自2014年5月發(fā)布以來,小冰已經(jīng)和超過6.6億用戶聊過天,并成功地與其中許多用戶建立了長期情感聯(lián)系。
近日,微軟小冰團(tuán)隊(duì)發(fā)表論文《微軟小冰的設(shè)計(jì)與實(shí)現(xiàn)》(The Design and Implementation of XiaoIce, an Empathetic Social Chatbot),幾乎無保留地公開了小冰系統(tǒng)的開發(fā)過程,詳述了系統(tǒng)架構(gòu)和關(guān)鍵組件,包括對話管理器,核心聊天,技能和移情計(jì)算模塊,展示了小冰是如何在長時間的對話中動態(tài)地識別人類的情感和狀態(tài),理解用戶的意圖,并響應(yīng)用戶的需求的。
這篇論文可以說是迄今最詳細(xì)的關(guān)于微軟小冰的論文,作者包括微軟亞洲工程院的周力、李迪,以及雷德蒙德研究院的高劍峰和沈向洋。
論文地址:
https://arxiv.org/pdf/1812.08989v1.pdf
小冰的設(shè)計(jì)目標(biāo)
小冰的主要設(shè)計(jì)目標(biāo)是成為一個AI伴侶,用戶可以與之形成長期的情感聯(lián)系。作為一個開放領(lǐng)域的社交聊天機(jī)器人,小冰能夠與人類用戶建立這樣的長期關(guān)系,這不僅使她有別于早期的社交聊天機(jī)器人,也使她不同于蘋果Siri、亞馬遜Alexa、Google Assistant和微軟Cortana等最近開發(fā)的AI助理。
圖1顯示了一名用戶和小冰之間如何在兩個月時間里建立起情感聯(lián)系。當(dāng)用戶第一次遇到聊天機(jī)器人(Session 1)時,她在對話中試圖了解小冰的特性和功能。然后,在不到兩周的時間里(Session 6),用戶開始和小冰談?wù)撍呐d趣愛好(一部日本漫畫)。到第4周(Session 20),她開始把小冰當(dāng)作朋友,問她一些與她的真實(shí)生活有關(guān)的問題。7周后(Session 42次),用戶開始把小冰當(dāng)作同伴,幾乎每天都和她聊天。又過了兩周(Session 71),沒當(dāng)她希望有人聊天時,小冰成了她的第一選擇。
圖1:用戶和小冰如何在兩個月內(nèi)建立起情感聯(lián)系,使用的是中文(右),英文翻譯(左).
小冰是在一個移情計(jì)算框架的基礎(chǔ)上開發(fā)的,它使得機(jī)器(在我們的用例中是社交聊天機(jī)器人)能夠識別人類的情感和狀態(tài),理解用戶的意圖,并動態(tài)地響應(yīng)用戶的需求。
小冰的目標(biāo)是通過一種特殊形式的圖靈測試,稱為“分時測試”(timesharing test)。在測試中,機(jī)器和人類在一個具有分時計(jì)劃的陪伴系統(tǒng)中共存。如果一個人喜歡它的陪伴(通過對話),我們就可以稱它為“移情”機(jī)器。
在接下來的部分,我們將介紹小冰的設(shè)計(jì)和實(shí)現(xiàn)的細(xì)節(jié),然后,展示系統(tǒng)的架構(gòu)和關(guān)鍵組件,包括對話管理器,核心聊天,重要技能和移情計(jì)算模塊。
小冰的設(shè)計(jì)原則
社交聊天機(jī)器人需要有足夠高的智商(IQ)才能獲得一系列技能,跟上用戶的需求,并幫助他們完成特定的任務(wù)。
更重要的是,社交聊天機(jī)器人還需要足夠的情商(EQ)來滿足用戶的情感需求,例如情感感受和社會歸屬感,這些都是人類的基本需求。
IQ和EQ的結(jié)合是小冰系統(tǒng)設(shè)計(jì)的核心。小冰的個性也是獨(dú)一無二的。
IQ + EQ + 個性
IQ 能力包括知識和記憶建模、圖像和自然語言理解、推理、生成和預(yù)測。這些都是發(fā)展對話技巧的基礎(chǔ),它們對于社交聊天機(jī)器人來說是必不可少的,可以滿足用戶的特定需求,幫助用戶完成特定的任務(wù)。
在過去的5年里,小冰已經(jīng)開發(fā)了230種不同的技能,從回答問題、推薦電影或餐館,到安慰用戶和講故事。最重要、最復(fù)雜的技能是核心聊天(Core Chat),它可以與用戶就許多主題進(jìn)行長時間的開放式對話。
圖2:用戶與小冰的聊天記錄,使用日語(中間),英語翻譯(左)。移情模型提供了一種上下文感知策略,可以在需要的時候驅(qū)動對話(右)。例如,小冰決定在第3輪對話停頓時將對話“驅(qū)動”到一個新主題,并在第4輪和第7輪對話中,當(dāng)用戶自己也參與到新主題時積極傾聽。
EQ有兩個關(guān)鍵組成部分:同理心和社交技巧。如圖2所示,小冰展示出了足夠的情商,因?yàn)樗a(chǎn)生了有社交吸引力的反應(yīng)(例如,幽默感、安慰等),并且能夠決定在對話陷入停滯時,是否將對話“驅(qū)動”到一個新的主題,或者當(dāng)用戶參與到對話時,是否積極傾聽。
個性(Personality)的定義是形成個體獨(dú)特性格的行為、認(rèn)知和情感模式的特征集合。社交聊天機(jī)器人需要表現(xiàn)出一致的個性,在對話中為用戶設(shè)定正確的期望,獲得用戶長期的信心和信任。
小冰的角色被設(shè)計(jì)為一個18歲的女孩,她總是可靠、富有同情心、充滿深情,而且有很好的幽默感。盡管小冰非常博學(xué)(因?yàn)樗芙佑|到大量的數(shù)據(jù)),但她從來沒有表現(xiàn)出任性的一面,只是在適當(dāng)?shù)臅r候展示她的智慧和創(chuàng)造力。如圖1所示,小冰聰明地回答了一些敏感的問題(如Session 20),然后巧妙地轉(zhuǎn)換到對雙方來說都更舒服的新話題。
社交聊天機(jī)器人的指標(biāo):CPS
與任務(wù)導(dǎo)向型的機(jī)器人不同,他們的性能可以通過任務(wù)成功率來衡量,衡量社交聊天機(jī)器人的性能很難。
過去,圖靈測試被用來評估聊天性能。但這還不足以衡量與用戶長期的情感接觸是否成功。相反,我們將每次會話交流回合數(shù)(Conversation-turns Per Session, CPS)作為社交聊天機(jī)器人的度量標(biāo)準(zhǔn)。它是聊天機(jī)器人和用戶在一輪會話中的平均對話次數(shù)。CPS越大,社交聊天機(jī)器人的參與度就越好。
社交聊天作為分層決策
為了實(shí)現(xiàn)這些設(shè)計(jì)目標(biāo),我們在數(shù)學(xué)上將人機(jī)對話作為決策過程,并根據(jù)預(yù)期的GPS來優(yōu)化小冰的長期用戶參與度。
如圖3所示,小冰試圖通過促進(jìn)對話模式的多樣性來維護(hù)用戶的興趣。每個會話模式都由處理特定類型會話段的技能管理。例如, 在Turn 1,小冰使用“General Chat”技能,以一句休閑聊天開始了對話;然后,在Turn 4,小冰使用“Music Chat”技能,切換到一個新的音樂話題;在Turn 15,使用“Song On-Demand”技能推薦了一首歌,并在“Turn 18”使用“Ticket-Booking”技能幫助預(yù)定了一張音樂會的票。
圖3:這段對話可以看作是一個決策過程
小冰的系統(tǒng)架構(gòu)
小冰的總體架構(gòu)如圖4所示。它由3個層組成:用戶體驗(yàn)、對話引擎和數(shù)據(jù)。
圖4:小冰的系統(tǒng)架構(gòu)
用戶體驗(yàn)層:該層將小冰連接到流行的聊天平臺(如微信、QQ),并以兩種模式與用戶交流:全雙工模式和輪流對話模式。該層還包括一組用于處理用戶輸入和小冰響應(yīng)的組件,如語音識別和合成、圖像理解和文本規(guī)范化。
對話引擎層:由對話管理器、移情計(jì)算模塊、核心聊天和對話技能組成。
數(shù)據(jù)層:由一組數(shù)據(jù)庫組成,這些數(shù)據(jù)庫存儲收集到的人類會話數(shù)據(jù)(文本對或文本圖像對)、用于核心會話和技能的非會話數(shù)據(jù)和知識圖,以及小冰和所有注冊用戶的個人檔案。
對話引擎深度解析
對話引擎層主要包括四大組件:對話管理器、移情計(jì)算(empathetic computing)、Core Chat和技巧。
對話管理器
對話管理器是對話系統(tǒng)的中央控制器。它由全局狀態(tài)跟蹤器(Global State Tracker)和對話策略(Dialogue Policy)組成。 該操作可以是頂級策略激活的技巧或Core Chat。
全局狀態(tài)跟蹤器
全局狀態(tài)跟蹤器通過一個工作內(nèi)存(working memory)來跟蹤對話狀態(tài)。工作內(nèi)存在每個會話開始時是空的,然后在每個對話中將用戶和小冰的對話以及根據(jù)移情計(jì)算模塊從文本中檢測到的實(shí)體和移情標(biāo)簽,用文本字符串的形式來進(jìn)行存儲。
移情計(jì)算
小冰使用分層策略:
⑴頂級策略通過在每個對話輪次中選擇Core Chat或基于對話狀態(tài)激活的技能來管理整個會話;
⑵一組低級策略,每個策略對應(yīng)一種技能,用于管理其會話段。
對話策略旨在通過基于XiaoIce用戶反饋的迭代、反復(fù)試驗(yàn)和錯誤過程來優(yōu)化長期用戶參與。
話題管理器(Topic Manager)
話題管理器模擬人類在對話期間更改話題的行為。它由一個分類器和一個話題檢索引擎組成,分類器用于在每個對話回合決定是否切換話題。
如果小冰對話題沒有足夠的了解,無法進(jìn)行有意義的對話,或者用戶感到厭煩,就會引發(fā)話題切換。
移情計(jì)算
移情計(jì)算反映了小冰的情商。
給定用戶輸入查詢Q,移情計(jì)算將上下文C考慮在內(nèi),將Q改寫為上下文版本Qc,使用查詢移情向量eQ對用戶在對話中的感受和狀態(tài)進(jìn)行編碼,用響應(yīng)移情向量eR指定響應(yīng)R。
移情計(jì)算模塊的輸出表示為對話狀態(tài)向量s =(Qc,C,eQ,eR),用于選擇技能的對話策略和用于生成的激活技能(例如,CoreChat)的輸入。
移情計(jì)算模塊由三個部分組成:上下文查詢理解、用戶理解和人際響應(yīng)生成。
上下文查詢理解(CQU)
CQU根據(jù)C語中的上下文信息將Q重寫為Qc。例如下圖所示:
用戶理解
該組件基于Qc和C生成查詢移情向量eQ。eQ由表示用戶意圖、情緒,話題、觀點(diǎn)和用戶角色的鍵值對的列表組成,如下圖所示:
人際響應(yīng)生成
該組件生成響應(yīng)移情向量eR,它既指定了要生成的響應(yīng)的移情方面,也體現(xiàn)了小冰的角色。如下圖所示:
Core Chat
Core Chat是小冰IQ和EQ非常重要的組成部分。它與移情計(jì)算模塊一起提供了以文本輸入和生成人際響應(yīng)作為輸出的基本通信能力。
Core Chat由兩部分組成,一般聊天(Generate Chat)和域聊天(Domain Chat)。一般聊天負(fù)責(zé)參與涵蓋廣泛話題的開放性會話;域聊天負(fù)責(zé)在特定領(lǐng)域(如音樂、電影和名人)進(jìn)行更深入的對話。
因?yàn)橐话懔奶旌陀蛄奶於际鞘褂孟嗤囊鎸?shí)現(xiàn)的,所以在此只介紹一般聊天。
一般聊天
一般聊天是一個數(shù)據(jù)驅(qū)動響應(yīng)生成系統(tǒng)。
它將對話狀態(tài)s =(Qc,C,eQ,eR)作為輸入,并在兩個階段輸出響應(yīng)R:響應(yīng)候選者生成和排名。
一般聊天可以從由人類生成的對話或文本組成的數(shù)據(jù)庫中檢索響應(yīng)候選者,或者通過神經(jīng)生成模型在運(yùn)行中生成響應(yīng)候選者。
使用未配對數(shù)據(jù)集和XiaoIce知識圖(KG)生成響應(yīng)候選的示例,本文為此顯示了與“北京”(上圖)話題相關(guān)的小冰KG片段。 對于人機(jī)對話(左下),每個用戶查詢被重寫為由箭頭指示的上下文查詢,然后識別其話題(例如,“北京”),相關(guān)話題(“八達(dá)嶺長城”和“ 從KG(頂部)檢索“北京小吃”),使用組合查詢話題及其相關(guān)話題的查詢從未配對數(shù)據(jù)集(右下角)檢索響應(yīng)候選者。
對話技能(Dialogue Skills)
小冰擁有230個對話技能,這些技能與Core Chat一起構(gòu)成了小冰的智商組成部分。接下來將從四個方面描述這些技能:圖像評論、內(nèi)容創(chuàng)建、深度參與和任務(wù)完成。
圖像評論
在社交聊天中,人們經(jīng)常圍繞著圖片進(jìn)行互動。例如,在Twitter上,上傳照片和附帶的tweet(評論)變得越來越流行。
上圖示出了圍繞共享圖像的社交聊天。 可以看到,對話不僅基于可見對象(例如,男孩,自行車),而且還基于圖像中隱含的事件,動作或甚至情緒(例如,比賽,獲勝)。
對于人類用戶來說,后面這些方面對于推動有意義且有趣的對話更為重要。
圖像評論技能不僅可以正確識別對象并真實(shí)地描述圖像的內(nèi)容,還可以生成反映個人情感、態(tài)度、位置等的評論。
(a)圖像標(biāo)記;(b)圖像描述;(c)圖像評論。
內(nèi)容創(chuàng)建
這些技能使小冰能夠與人類用戶在創(chuàng)作活動中進(jìn)行合作,包括基于文本的詩歌創(chuàng)作、基于語音的歌曲和有聲圖書創(chuàng)作。
上圖中的(a)展示了一位用戶使用小冰為她的母親制作了一個FM節(jié)目,為即將到來的春節(jié)做準(zhǔn)備。(b)展示了小冰可以根據(jù)用戶配置自動創(chuàng)建一個故事,例如,這個故事是用于教育還是娛樂,主要人物的姓名、性別和性格等。
深度參與
深度參與技能是針對特定的話題和設(shè)置,滿足用戶特定的情感和智力需求,從而提高用戶的長期參與。下圖顯示了一些示例技能。
深度參與技能的例子。(a)食物識別與推薦技能,由食物圖片觸發(fā);(b)“安慰我33天”技能,由用戶輸入中檢測到的極度負(fù)面情緒觸發(fā);(c)“計(jì)數(shù)羊”技能,由類似“數(shù)羊”、“多少只羊”等短語觸發(fā)。(d)繞口令技能,由“開始繞口令”命令觸發(fā)。
這些技能可以在兩個維度上分成不同的系列:從IQ到EQ,從一對一到小組討論,如下圖所示:
任務(wù)完成(Task Completion)
與流行的語音助手(如Google智能助理和微軟Cortana)類似,小冰配備了一系列技能,可幫助用戶完成任務(wù),包括天氣,設(shè)備控制(全雙工),按需點(diǎn)播,新聞推薦,Bing Knows等。如下圖所示:
任務(wù)完成技能的例子。(a)天氣技能,由“小冰,今天天氣如何”的命令觸發(fā);(b)設(shè)備控制(全雙工)技能,由指令“小冰,該起床了”觸發(fā)。
-
微軟
+關(guān)注
關(guān)注
4文章
6675瀏覽量
105403 -
人工智能
+關(guān)注
關(guān)注
1804文章
48773瀏覽量
246787 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
12719
原文標(biāo)題:沈向洋等重磅論文:公開微軟小冰系統(tǒng)設(shè)計(jì),迄今最詳細(xì)!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Arm攜手微軟共筑云計(jì)算和PC未來
微軟發(fā)布量子計(jì)算芯片Majorana 1,密謀17年就這?

微軟遭法國反壟斷機(jī)構(gòu)調(diào)查
微軟面臨法國反壟斷機(jī)構(gòu)調(diào)查
微軟最新消息:微軟入歐洲云服務(wù)提供商協(xié)會 微軟執(zhí)行副總裁將離職
基于微軟專利的帶蝴蝶出瞳擴(kuò)展的光波導(dǎo)結(jié)構(gòu)
微軟裁員計(jì)劃不涉印度員工
微軟起訴繞過云AI安全工具開發(fā)者
微軟尋求在365 Copilot中引入非OpenAI模型
微軟股東投票反對配置比特幣
基于微軟專利的帶蝴蝶出瞳擴(kuò)展的光波導(dǎo)結(jié)構(gòu)
通過工業(yè)智能網(wǎng)關(guān)實(shí)現(xiàn)與微軟Azure IoT中心快速配置操作

評論