9月28日,在業(yè)內(nèi)舉足輕重的科技巨擘Google、Facebook、IBM、亞馬遜和微軟共同宣布成立一家非營利機(jī)構(gòu)——AI合作組織(Partnership on Artificial Intelligence to Benefit People and Society),首次在人工智能領(lǐng)域建立合作關(guān)系。
這一組織的成立旨在對(duì)有關(guān)人工智能具體如何影響社會(huì)的倫理問題展開研究,令人工智能技術(shù)的開發(fā)更加可控和透明,同時(shí)也是為了遏制人們對(duì)這項(xiàng)日益精進(jìn)的技術(shù)產(chǎn)生的擔(dān)憂。
這是為“邪術(shù)”出籠前準(zhǔn)備好的“十字架與圣水”,有悲觀人士如斯評(píng)價(jià)。
我們已經(jīng)自覺或不自覺地開始步入人工智能時(shí)代了。
幾天前的Google硬件發(fā)布會(huì)上,CEO劈柴花大量時(shí)間介紹了Google Assistant(谷歌面向消費(fèi)者的人工智能虛擬助手,其核心能力包括:知識(shí)圖譜、自然語言處理、翻譯、語音識(shí)別、圖像識(shí)別)的進(jìn)步和價(jià)值。 Google已將這一服務(wù)植入到了Google手機(jī)Pixel和Google Home以及更多的應(yīng)用領(lǐng)域當(dāng)中,甚至包括智能穿戴以及智能汽車。透露出Google領(lǐng)跑人工智能時(shí)代的野心。
科技巨頭的野心預(yù)示著AI發(fā)展將進(jìn)入更廣更深的領(lǐng)域,產(chǎn)生更大的影響,使工業(yè)生產(chǎn)、金融、律師、管理顧問、記者等眾多行業(yè)從業(yè)人員都面臨被AI 替代的失業(yè)風(fēng)險(xiǎn)。英國BBC電視臺(tái)甚至預(yù)測(cè),將近一半的普通職業(yè)從業(yè)者面臨著50%被人工智能取代的危險(xiǎn)。AI對(duì)新聞媒體行業(yè)從業(yè)者也將會(huì)帶來前所未有的強(qiáng)烈沖擊。
比如Google最新開發(fā)出的“神經(jīng)機(jī)器翻譯”(Neural machine translation),已經(jīng)非常接近人類的翻譯。話說,新聞翻譯的活兒是不是就可以直接交給機(jī)器來干了?
隨著人工智能程序AlphaGo完勝九段棋手李世石,自動(dòng)化新聞寫作機(jī)器人的成功開發(fā),不久的將來,新聞媒體記者是不是就要被替代呢?
什么是AI?
在探討AI帶給媒體行業(yè)的影響前,我們先要了解AI的正確含義。
AI是人工智能(Artificial Intelligence)的英文縮寫,是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
CrowdFlower眾包數(shù)據(jù)處理公司的CEO Robin Bordoli在《關(guān)于人工智能的七大常見誤解》一文中提出了人工智能的有3個(gè)互相連鎖的關(guān)鍵概念:
1.訓(xùn)練數(shù)據(jù)(TrainingData,TD)訓(xùn)練數(shù)據(jù)是機(jī)器可以用來學(xué)習(xí)的起始數(shù)據(jù)來源集。訓(xùn)練數(shù)據(jù)有輸入值和帶有答案的輸出值,這樣機(jī)器學(xué)習(xí)模型可以從答案中尋找模式。比如,輸入可以是客服單,帶有客戶和公司的客服代表之間的電子郵件。輸出可以是基于公司某個(gè)分類定義的從1到5的分類標(biāo)簽。
2.機(jī)器學(xué)習(xí)(MachineLearning,ML)機(jī)器學(xué)習(xí)是軟件從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到某種模式,并把它應(yīng)用到新的輸入數(shù)據(jù)中。比如,一個(gè)新的客服單,帶有某位客戶和某位公司客服代表的郵件來了,機(jī)器學(xué)習(xí)模型可以預(yù)測(cè)出一個(gè)分類,并告訴你它對(duì)該分類的把握有多大。機(jī)器學(xué)習(xí)的關(guān)鍵特征是,它不是通過固定的規(guī)則來學(xué)習(xí)。因此,當(dāng)它消化新的數(shù)據(jù)后會(huì)調(diào)整其規(guī)則。
3.人機(jī)回圈(Human-in-the-Loop,HITL)人機(jī)回圈是人工智能的第三個(gè)核心部分。我們不能指望機(jī)器學(xué)習(xí)萬無一失。一個(gè)好的機(jī)器學(xué)習(xí)模型大約只有70%的準(zhǔn)確性。因此你需要一個(gè)人機(jī)回圈流程,當(dāng)模型的可信度低時(shí),還可以依靠人。
于是我們可以得到AI的基本公式:AI = TD + ML + HITL
由此我們可以總結(jié)出有關(guān)AI的3個(gè)關(guān)鍵信息:
1.人工智能不是一開始就具有高超智能的,而是需要一個(gè)數(shù)據(jù)樣本集對(duì)其進(jìn)行訓(xùn)練。
2.機(jī)器獲得智能本質(zhì)上是從大量的樣本數(shù)據(jù)中學(xué)會(huì)了一種模式,并隨樣本數(shù)據(jù)的更新不斷更新其對(duì)模式的認(rèn)識(shí)。
3.至少在當(dāng)今,人工智能要做到萬無一失還少不了人工把關(guān)。
AI會(huì)給新聞業(yè)帶來怎樣的影響?
了解了AI的含義,讓我們來看看AI在新聞?lì)I(lǐng)域的應(yīng)用。
抓取歷史數(shù)據(jù)并生成圖表
2016年8月30日,路透社與語義技術(shù)公司Graphiq宣布合作,旨在讓數(shù)據(jù)可視化變得觸手可及。Graphic公司有一個(gè)集結(jié)了50多位研發(fā)人員和數(shù)據(jù)專家的團(tuán)隊(duì),專門負(fù)責(zé)收集經(jīng)濟(jì)、體育、娛樂等各個(gè)領(lǐng)域的數(shù)據(jù)。路透社借此利用AI實(shí)現(xiàn)了迅速抓取歷史數(shù)據(jù)并生成圖表,增強(qiáng)了新聞的實(shí)效性和可視性。
篩選“熱門話題”
Facebook在8月26日宣布趨勢(shì)話題撤掉人工編輯,完全依靠算法篩選熱門新聞的趨勢(shì)話題,做出了擁抱AI的勇敢嘗試。但打臉的是,還不到3天,就讓一則關(guān)于美國福克斯新聞主播梅根?凱利的假新聞登上了版面。
據(jù)報(bào)道,這是由于Facebook機(jī)器篩選“熱門話題”依賴于該話題的相關(guān)文章和貼文數(shù)量,而非對(duì)于內(nèi)容的判斷。由此可見在當(dāng)前技術(shù)情況下想要避免假新聞還得要人工把關(guān)。
制作視頻
2016年6月,原論壇報(bào)集團(tuán)(Tribune Publishing)宣布將公司更名為Tronc,并專注于使用人工智能制作內(nèi)容。在接受CNBC電視臺(tái)采訪時(shí),公司CEO Michael Ferro表示Tronc將會(huì)使用人工智能制作大量視頻。但就目前的AI技術(shù)來說,利用AI是否能作出高質(zhì)量的視頻引起業(yè)界人士的質(zhì)疑。
撰寫新聞
人工智能寫新聞已經(jīng)不是一件新鮮事了。
2015年7月,美聯(lián)社和科技公司Automated Insights合作,采用人工智能技術(shù)來報(bào)道商業(yè)領(lǐng)域的企業(yè)財(cái)報(bào)新聞。從300份一季度到3000份一季度,這次合作幫助美聯(lián)社大大地提高了財(cái)報(bào)數(shù)量,據(jù)顧客反映正確率也大大提高。
2015年9月10日,騰訊網(wǎng)財(cái)經(jīng)頻道發(fā)出題為《8月CPI同比上漲2.0% 創(chuàng)12個(gè)月新高》的第一篇由自動(dòng)化新聞寫作機(jī)器人完成的稿件,引起新聞界關(guān)注。
在今年的里約奧運(yùn)會(huì)上,今日頭條實(shí)驗(yàn)室自助研發(fā)的AI機(jī)器人張小明通過兩種文本生成技術(shù)產(chǎn)出新聞:一是針對(duì)數(shù)據(jù)庫中表格數(shù)據(jù)和知識(shí)庫生成自然語言的比賽結(jié)果報(bào)道,即簡(jiǎn)訊;二是利用體育比賽文字直播精煉合成比賽過程的總結(jié)報(bào)道,即資訊。奧運(yùn)會(huì)期間通過對(duì)接奧組委的數(shù)據(jù)庫信息,實(shí)時(shí)撰寫新聞稿件,在 6天共生成超200篇簡(jiǎn)訊和資訊。
用戶分析,個(gè)性化推送
在信息爆炸,用戶需求多樣化個(gè)性化的時(shí)代, 媒體如果想為100萬讀者制作100萬個(gè)他們需要的個(gè)性化頭版,就只能依靠人工智能(算法)了。Youtube、SmartNews、今日頭條等新聞媒體都依靠人工智能算法獲得了成功。
由此可見,AI在抓取歷史數(shù)據(jù)并生成圖表;篩選“熱門話題”;制作視頻;撰寫新聞;用戶分析,個(gè)性化推送等方面都發(fā)揮著強(qiáng)大的作用,引領(lǐng)著新聞媒體行業(yè)走向一場(chǎng)深刻的變革。
但由于技術(shù)限制,當(dāng)今的AI還有很多缺陷,短期內(nèi)不可能完全取代新聞?dòng)浾撸S著技術(shù)不斷進(jìn)步,AI逐步趨于完善,也許在不久的將來就會(huì)取代很多新聞?dòng)浾摺?/p>
尤其是通訊稿式的新聞,很快就可以只靠機(jī)器人加上簡(jiǎn)單的人工把控輕易而高效率的完成了,這就要求新聞業(yè)工作者不能只求時(shí)效性和數(shù)量,更要追求內(nèi)容的質(zhì)量與深度。簡(jiǎn)單傳達(dá)信息的工作將會(huì)被機(jī)器人取代,我們要轉(zhuǎn)而傳達(dá)思考與文化。
ColdFusionTV在《阿爾法狗背后的谷歌DeepMind:能自我學(xué)習(xí)的人工智能》中深入分析AI對(duì)未來的影響后得出結(jié)論:“人工智能可以接管很多信息密集型的專業(yè)工作,只為我們留下創(chuàng)造力和情感為本質(zhì)的工作,這些或許是人工智能永遠(yuǎn)無法習(xí)得的。”
這樣的結(jié)論讓我們感到些許欣慰,畢竟創(chuàng)造力和情感是機(jī)器無法與人比擬的。但是機(jī)器真的無法做出創(chuàng)造性的工作么?
AI有創(chuàng)造性么?
藝術(shù)領(lǐng)域一直被視為人類情感和感性的領(lǐng)域,但連這樣的領(lǐng)域AI都開始涉足。
Oscar Schwartz在題為《電腦能寫詩嗎?》的TED演講中證明了電腦是可以寫詩的。
現(xiàn)在我們來做一個(gè)小測(cè)試,下圖的兩首詩一首是人類詩人創(chuàng)作的,而另一首是由機(jī)器生成的,你能猜出哪一個(gè)是機(jī)器所作么?
這是講師在演講現(xiàn)場(chǎng)給觀眾提出的問題。
但當(dāng)時(shí)只有個(gè)別幾個(gè)觀眾猜對(duì)了。
答案是,詩歌1是人類詩人格特魯?shù)滤固┮驅(qū)懗傻模诙讋t是由RKCP的算法所寫的。RKCP是由谷歌設(shè)計(jì)師總管雷科茲威爾設(shè)計(jì)的演算法。原理是你給RKCP一個(gè)原文本,而它通過原文本了解到人類如何使用語言,然后創(chuàng)造出一種和該文本相似的語言。即為在本文開頭所提到的訓(xùn)練數(shù)據(jù)+機(jī)器學(xué)習(xí)原理。詩歌2其實(shí)是受到詩人艾美莉迪金森的影響寫成的。
怎么樣?你猜對(duì)了么?
其實(shí)早在20世紀(jì)50年代,計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)阿蘭?麥席森?圖靈就設(shè)計(jì)出了有名的圖靈測(cè)試,其內(nèi)容是,如果電腦能在5分鐘內(nèi)回答由人類測(cè)試者提出的一系列問題,且其超過30%的回答讓測(cè)試者誤認(rèn)為是人類所答,則電腦通過測(cè)試。2014年6月8日,一臺(tái)計(jì)算機(jī)成功讓人類相信它是一個(gè)13歲的男孩,成為有史以來首臺(tái)通過圖靈測(cè)試的計(jì)算機(jī)。這被認(rèn)為是人工智能發(fā)展的一個(gè)里程碑事件。
除了會(huì)寫詩,AI最近又開始進(jìn)軍音樂領(lǐng)域。
最近,索尼音樂的計(jì)算機(jī)科學(xué)研究實(shí)驗(yàn)室(Sony CSL)發(fā)布了兩首完全由人工智能作曲的流行歌曲,稱這是有突破性的第一次。無數(shù)網(wǎng)友表示本以為會(huì)效果感人,但親測(cè)真的很好聽。旋律易記的《Daddy‘s Car》,是人工智能模仿The Beatles樂隊(duì)的風(fēng)格創(chuàng)作的,有種陽光明媚在路上吹風(fēng)的感覺,大家有興趣可以試聽感受一下。
詩歌、音樂、語言。曾近被我們認(rèn)為最需要人類感性的領(lǐng)域,實(shí)踐證明AI同樣也可以做的很好。
照這個(gè)邏輯,在人工智能不斷發(fā)展下,不久的將來機(jī)器人寫分析性預(yù)測(cè)性的文章,寫深度長(zhǎng)文報(bào)道,復(fù)雜選題的特稿是否也能得心應(yīng)手呢?這不得不讓眾多媒體人感到恐慌。
機(jī)器人會(huì)取代媒體人么?
別著急,讓我們先來仔細(xì)想想機(jī)器人是怎么創(chuàng)作詩和歌曲的吧。
在這兩個(gè)案例中,機(jī)器人都是通過輸入大量的源樣本,從中進(jìn)行模式學(xué)習(xí),進(jìn)而創(chuàng)作出有某人風(fēng)格的作品,有的時(shí)候(如歌曲的最終完成)還需要加以人工輔助來完成的。
其實(shí)完全符合AI = TD + ML + HITL的公式。
即使是隨著技術(shù)的進(jìn)步,人機(jī)回圈的必要性越來越小,AI是否就可以取代新聞媒體記者,寫出比人類更好的新聞報(bào)道呢?
也許你會(huì)說是的,畢竟阿爾法狗就戰(zhàn)勝了人類。
但是圍棋比賽和做新聞?dòng)斜举|(zhì)區(qū)別。
記者的不斷創(chuàng)新才是AI創(chuàng)作的源泉
圍棋與創(chuàng)作最大的區(qū)別在于圍棋有勝負(fù),并且只有圍棋本身的規(guī)律,不隨時(shí)代而改變。在阿爾法狗的訓(xùn)練過程中,是先讓其學(xué)習(xí)無數(shù)的人類下棋模式后,再讓不同版本的阿爾法狗之間進(jìn)行比賽,并對(duì)新的比賽過程進(jìn)行學(xué)習(xí),使其不斷超越機(jī)器自身,最終才得以超越人類。
而創(chuàng)作領(lǐng)域沒有輸贏之分,好壞也是很主觀的事情,所以沒有辦法讓其自身不同版本之間進(jìn)行競(jìng)爭(zhēng),也就很難想到方法讓其只靠學(xué)習(xí)以前的文章就能持續(xù)提高水平,寫出比人類記者更優(yōu)秀的文章。
要寫出好文章,就要輸入大量?jī)?yōu)秀的的樣本,而這些優(yōu)秀的樣本創(chuàng)造需要無數(shù)記者充分發(fā)揮創(chuàng)造力,如果沒有無數(shù)記者的不斷創(chuàng)新,只有機(jī)器人在現(xiàn)有的文章中不斷學(xué)習(xí),很難想象怎么能與時(shí)俱進(jìn)地寫出越來越好的文章以及新聞報(bào)道。
也許隨著技術(shù)進(jìn)步AI能寫出比大多數(shù)普通記者都好的文章,這就對(duì)記者提出了更高的要求,但AI最終無法超越不斷創(chuàng)新的廣大記者群體。
AI的前進(jìn)方向由媒體人決定
另外,更重要的是,在為AI機(jī)器人訓(xùn)練時(shí),給它們?cè)鯓拥臉颖救Q于人類對(duì)這一工作本質(zhì)的認(rèn)識(shí)。
Oscar Schwartz講師在演講中提到,人工智能的發(fā)展是一面鏡子,AI機(jī)器人并非會(huì)創(chuàng)作,它們只會(huì)通過學(xué)習(xí)來做的無限像人的某一個(gè)方面。而我們則需要決定“要讓人工智能像人類的哪一個(gè)方面”。
這一決定需要我們對(duì)人本身,對(duì)新聞和媒介本身有更深的理解。
例如,如果要利用AI為用戶個(gè)性化篩選新聞,我們首先要想明白作為一個(gè)用戶最需要怎樣的新聞,如何避免僅靠用戶的瀏覽記錄來推送文章時(shí)可能引發(fā)的信息娛樂化和狹窄化。
如果想要利用AI寫出好的新聞深度報(bào)道,我們需要想明白究竟什么堪稱優(yōu)秀的新聞報(bào)道,需要從我們自己平時(shí)寫深度報(bào)道時(shí)如何收集材料,如何歸納分析,如何創(chuàng)新中總結(jié)出一種規(guī)律。
如果寫分析預(yù)測(cè),我們則需要知道需要考慮到哪些因素,收集哪些數(shù)據(jù)來進(jìn)行分析預(yù)測(cè)。
需要與用戶進(jìn)行互動(dòng),建立關(guān)系時(shí),我們首先要知道用戶需要怎樣的關(guān)系,這個(gè)關(guān)系隨時(shí)代怎么改變。
也就是說,AI說到底是增強(qiáng)人類某一方面能力的輔助,而需要增強(qiáng)哪一方面能力,需要怎么增強(qiáng),這個(gè)最關(guān)鍵的方向性問題需要我們來思考。
正如ColdFusionTV所說“人工智能研究的原點(diǎn)是人腦,是人類對(duì)于自己大腦的理解的反映”,所有的規(guī)律和奧秘其實(shí)都在我們自身。
所以對(duì)于每一個(gè)媒體人來說,只有我們更深入地了解新聞媒體行業(yè)的本質(zhì)和人類通過媒介獲得信息、人的思考方式的本質(zhì),加深A(yù)I領(lǐng)域的人文探索,才能使AI更好的為我們所用。這是AI對(duì)所有媒體人全新的挑戰(zhàn)。
評(píng)論