污染中文互聯(lián)網(wǎng),AI成了“罪魁禍?zhǔn)住敝弧?/p>
事情是這樣的。
最近大家不是都熱衷于向AI咨詢(xún)嘛,有位網(wǎng)友就問(wèn)了Bing這么一個(gè)問(wèn)題:
象鼻山是否有纜車(chē)?
Bing也是有問(wèn)必答,給出了看似挺靠譜的答案:
在給出肯定的答復(fù)之后,Bing還貼心地附帶上了票價(jià)、營(yíng)業(yè)時(shí)間等細(xì)節(jié)信息。
不過(guò)這位網(wǎng)友并沒(méi)有直接采納答案,而是順藤摸瓜點(diǎn)開(kāi)了下方的“參考鏈接”。
此時(shí)網(wǎng)友察覺(jué)到了一絲絲的不對(duì)勁——這人的回答怎么“機(jī)里機(jī)氣”的。
于是他點(diǎn)開(kāi)了這位叫“百變?nèi)松钡挠脩?hù)主頁(yè),猛然發(fā)覺(jué),介是個(gè)AI啊!
因?yàn)檫@位用戶(hù)回答問(wèn)題速度可以說(shuō)是極快,差不多每1、2分鐘就能搞定一個(gè)問(wèn)題。
甚至能在1分鐘之內(nèi)回答2個(gè)問(wèn)題。
在這位網(wǎng)友更為細(xì)心的觀察之下,發(fā)現(xiàn)這些回答的內(nèi)容都是沒(méi)經(jīng)過(guò)核實(shí)的那種……
可以發(fā)現(xiàn)這個(gè) ai 賬戶(hù)在以極快的速度將未經(jīng)核實(shí)的信息輸出到中文互聯(lián)網(wǎng),并且誤導(dǎo)了 bing ai ,以至于 bing 給出了錯(cuò)誤的答案
并且他認(rèn)為,這就是導(dǎo)致Bing輸出錯(cuò)誤答案的原因:
這個(gè)AI瘋狂地污染中文互聯(lián)網(wǎng)。
“AI污染源”,不止這一個(gè)
那么被網(wǎng)友發(fā)現(xiàn)的這位AI用戶(hù),現(xiàn)在怎么樣了?
從目前結(jié)果來(lái)看,他已經(jīng)被被知乎“判處”為禁言狀態(tài)。
但盡管如此,也有其他網(wǎng)友直言不諱地表示:
不止一個(gè)。
若是點(diǎn)開(kāi)知乎的“等你回答”這個(gè)欄目,隨機(jī)找一個(gè)問(wèn)題,往下拉一拉,確實(shí)是能碰到不少“機(jī)言機(jī)語(yǔ)”的回答。
例如我們?cè)凇癆I在生活中的應(yīng)用場(chǎng)景有哪些?”的回答中便找到了一個(gè):
不僅是回答的語(yǔ)言“機(jī)言機(jī)語(yǔ)”,甚至回答直接打上了“包含AI輔助創(chuàng)作”的標(biāo)簽。
然后如果我們把問(wèn)題丟給ChatGPT,那么得到回答……嗯,挺換湯不換藥的。
事實(shí)上,諸如此類(lèi)的“AI污染源”不止是在這一個(gè)平臺(tái)上有。
就連簡(jiǎn)單的科普配圖這事上,AI也是屢屢犯錯(cuò)。
網(wǎng)友們看完這事也是蚌埠住了:“好家伙,沒(méi)有一個(gè)配圖是河蚌”。
甚至各類(lèi)AI生成的假新聞也是屢見(jiàn)不鮮。
例如前一段時(shí)間,便有一則聳人聽(tīng)聞的消息在網(wǎng)上瘋傳,標(biāo)題是《鄭州雞排店驚現(xiàn)血案,男子用磚頭砸死女子!》。
但事實(shí)上,這則新聞是江西男子陳某為吸粉引流,利用ChatGPT生成的。
無(wú)獨(dú)有偶,廣東深圳的洪某弟也是通過(guò)AI技術(shù),發(fā)布過(guò)《今晨,甘肅一火車(chē)撞上修路工人, 致9人死亡》假新聞。
具體而言,他在全網(wǎng)搜索近幾年的社會(huì)熱點(diǎn)新聞,并使用AI軟件對(duì)新聞時(shí)間、地點(diǎn)等進(jìn)行修改編輯后,在某些平臺(tái)賺取關(guān)注和流量進(jìn)行非法牟利。
警方均已對(duì)他們采取了刑事強(qiáng)制措施。
但其實(shí)這種“AI污染源”的現(xiàn)象不僅僅是在國(guó)內(nèi)存在,在國(guó)外亦是如此。
程序員問(wèn)答社區(qū)Stack Overflow便是一個(gè)例子。
早在去年年底ChatGPT剛火起來(lái)的時(shí)候,Stack Overflow便突然宣布“臨時(shí)禁用”。
當(dāng)時(shí)官方給出來(lái)的理由是這樣的:
(這樣做)的目的是減緩使用ChatGPT創(chuàng)建的大量答案流入社區(qū)。
因?yàn)閺腃hatGPT得到錯(cuò)誤答案的概率太高了!
Stack Overflow進(jìn)一步闡述了這種現(xiàn)象。
他們認(rèn)為以前用戶(hù)回答的問(wèn)題,都是會(huì)有專(zhuān)業(yè)知識(shí)背景的其他用戶(hù)瀏覽,并給出正確與否,相當(dāng)于是核實(shí)過(guò)。
但自打ChatGPT出現(xiàn)之后,涌現(xiàn)了大量讓人覺(jué)得“很對(duì)”的答案;而有專(zhuān)業(yè)知識(shí)背景的用戶(hù)數(shù)量是有限,沒(méi)法把這些生成的答案都看個(gè)遍。
加之ChatGPT回答這些個(gè)專(zhuān)業(yè)性問(wèn)題,它的錯(cuò)誤率是實(shí)實(shí)在在擺在那里的;因此Stack Overflow才選擇了禁用。
一言蔽之,AI污染了社區(qū)環(huán)境。
而且像在美版貼吧Reddit上,也是充斥著較多的ChatGPT板塊、話(huà)題:
許多用戶(hù)在這種欄目之下會(huì)提出各式各樣的問(wèn)題,ChatGPT bot也是有問(wèn)必答。
不過(guò),還是老問(wèn)題,答案的準(zhǔn)確性如何,就不得而知了。
但這種現(xiàn)象背后,其實(shí)還隱藏著更大的隱患。
基于 Spring Boot + MyBatis Plus + Vue & Element 實(shí)現(xiàn)的后臺(tái)管理系統(tǒng) + 用戶(hù)小程序,支持 RBAC 動(dòng)態(tài)權(quán)限、多租戶(hù)、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能
項(xiàng)目地址:https://github.com/YunaiV/ruoyi-vue-pro
視頻教程:https://doc.iocoder.cn/video/
濫用AI,也毀了AI
AI模型獲得大量互聯(lián)網(wǎng)數(shù)據(jù),卻無(wú)法很好地辨別信息的真實(shí)性和可信度。
結(jié)果就是,我們不得不面對(duì)一大堆快速生成的低質(zhì)量?jī)?nèi)容,讓人眼花繚亂,頭暈?zāi)垦!?/p>
很難想象ChatGPT這些大模型如果用這種數(shù)據(jù)訓(xùn)練,結(jié)果會(huì)是啥樣……
而如此濫用AI,反過(guò)來(lái)也是一種自噬。
最近,英國(guó)和加拿大的研究人員在arXiv上發(fā)表了一篇題目為《The Curse of Recursion: Training on Generated Data Makes Models Forget》的論文。
探討了現(xiàn)在AI生成內(nèi)容污染互聯(lián)網(wǎng)的現(xiàn)狀,然后公布了一項(xiàng)令人擔(dān)憂(yōu)的發(fā)現(xiàn),使用模型生成的內(nèi)容訓(xùn)練其他模型,會(huì)導(dǎo)致結(jié)果模型出現(xiàn)不可逆的缺陷。
這種AI生成數(shù)據(jù)的“污染”會(huì)導(dǎo)致模型對(duì)現(xiàn)實(shí)的認(rèn)知產(chǎn)生扭曲,未來(lái)通過(guò)抓取互聯(lián)網(wǎng)數(shù)據(jù)來(lái)訓(xùn)練模型會(huì)變得更加困難。
論文作者,劍橋大學(xué)和愛(ài)丁堡大學(xué)安全工程教授Ross Anderson毫不避諱的直言:
正如我們用塑料垃圾布滿(mǎn)了海洋,用二氧化碳填滿(mǎn)了大氣層,我們即將用廢話(huà)填滿(mǎn)互聯(lián)網(wǎng)。
對(duì)于虛假信息滿(mǎn)天飛的情況,Google Brain的高級(jí)研究科學(xué)家達(dá)芙妮 · 伊波利托(Daphne Ippolito)表示:想在未來(lái)找到高質(zhì)量且未被AI訓(xùn)練的數(shù)據(jù),將難上加難。
假如滿(mǎn)屏都是這種無(wú)營(yíng)養(yǎng)的劣質(zhì)信息,如此循環(huán)往復(fù),那以后AI就沒(méi)有數(shù)據(jù)訓(xùn)練,輸出的結(jié)果還有啥意義呢。
基于這種狀況,大膽設(shè)想一下。一個(gè)成長(zhǎng)于垃圾、虛假數(shù)據(jù)環(huán)境中的AI,在進(jìn)化成人前,可能就先被擬合成一個(gè)“智障機(jī)器人”、一個(gè)心理扭曲的心理智障。
就像1996年的科幻喜劇電影《丈夫一籮筐》,影片講述了一個(gè)普通人克隆自己,然后又克隆克隆人,每一次克隆都導(dǎo)致克隆人的智力水平呈指數(shù)下降,愚蠢程度增加。
那個(gè)時(shí)候,我們可能將不得不面臨一個(gè)荒謬?yán)Ь常喝祟?lèi)創(chuàng)造了具有驚人能力的AI,而它卻塞滿(mǎn)了無(wú)聊愚蠢的信息。
如果AI被喂進(jìn)的只是虛假的垃圾數(shù)據(jù),我們又能期待它們創(chuàng)造出什么樣的內(nèi)容呢?
假如時(shí)間到那個(gè)時(shí)候,我們大概都會(huì)懷念過(guò)去,向那些真正的人類(lèi)智慧致敬吧。
話(huà)雖如此,但也不全壞消息。比如部分內(nèi)容平臺(tái)已開(kāi)始關(guān)注AI生成低劣內(nèi)容的問(wèn)題,并推出相關(guān)規(guī)定加以限制。
一些個(gè)AI公司也開(kāi)始搞能鑒別AI生成內(nèi)容的技術(shù),以減少AI虛假、垃圾信息的爆炸。
對(duì)于這樣的事情,你怎么看?
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11251瀏覽量
106473 -
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280035 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1590瀏覽量
9112
原文標(biāo)題:AI,正在瘋狂污染中文互聯(lián)網(wǎng)
文章出處:【微信號(hào):芋道源碼,微信公眾號(hào):芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
鯤云科技入選AII工業(yè)互聯(lián)網(wǎng)應(yīng)用案例
華為AI WAN智算IP廣域網(wǎng)助力算力互聯(lián)網(wǎng)建設(shè)
研華科技亮相2025工業(yè)互聯(lián)網(wǎng)大會(huì)
官網(wǎng)下載的stm32cubemx無(wú)法連接互聯(lián)網(wǎng),WiFi有一條斜杠,怎么解決?
IPv6是新質(zhì)互聯(lián)網(wǎng)時(shí)代,AI 賦能下的網(wǎng)絡(luò)基石

一文解析工業(yè)互聯(lián)網(wǎng)
云互聯(lián)網(wǎng)是什么意思
Coremail亮相世界互聯(lián)網(wǎng)大會(huì)“互聯(lián)網(wǎng)之光”博覽會(huì)


石家莊數(shù)字孿生工業(yè)互聯(lián)網(wǎng)三維可視化技術(shù),賦能新型工業(yè)化智能制造工廠#石家莊#數(shù)字孿生#工業(yè)互聯(lián)網(wǎng)#三維可視化
燒結(jié)銀在衛(wèi)星互聯(lián)網(wǎng)中的四大應(yīng)用
深入解析:純凈IP如何重構(gòu)互聯(lián)網(wǎng)環(huán)境
恒訊科技介紹:互聯(lián)網(wǎng)專(zhuān)線(xiàn)是什么意思?有什么優(yōu)勢(shì)?

賽昉科技能源互聯(lián)網(wǎng)實(shí)踐案例——全球首款RISC-V能量路由器

評(píng)論