目前,機(jī)器學(xué)習(xí)已經(jīng)深入各個(gè)科研領(lǐng)域,并產(chǎn)生了深遠(yuǎn)的影響。無(wú)獨(dú)有偶,許多科學(xué)家利用機(jī)器學(xué)習(xí)產(chǎn)生的結(jié)果卻具有誤導(dǎo)性,甚至往往完全是錯(cuò)誤的。因此,來(lái)自休斯頓萊斯大學(xué)的Genevera Allen博士發(fā)出警告:若不改進(jìn)技術(shù),機(jī)器學(xué)習(xí)系統(tǒng)使用量的激增將導(dǎo)致一場(chǎng)“科學(xué)危機(jī)”。
警告:機(jī)器學(xué)習(xí)導(dǎo)致了一場(chǎng)“科學(xué)危機(jī)”!
目前,許多科學(xué)家用機(jī)器學(xué)習(xí)技術(shù)來(lái)分析數(shù)據(jù)等,但其產(chǎn)生的結(jié)果有時(shí)是具有誤導(dǎo)性的,而且往往是完全錯(cuò)誤性的。
來(lái)自休斯頓萊斯大學(xué)的Genevera Allen博士說(shuō),這種系統(tǒng)使用的增加導(dǎo)致了一場(chǎng)“科學(xué)危機(jī)”。
她警告科學(xué)家們:
如果科學(xué)家們不對(duì)機(jī)器學(xué)習(xí)技術(shù)進(jìn)行改進(jìn),就等同于浪費(fèi)時(shí)間和金錢。
采用機(jī)器學(xué)習(xí)技術(shù)來(lái)分析處理已有的數(shù)據(jù)集像是一股熱潮,從生物醫(yī)學(xué)到天文學(xué),比比皆是。而且這些數(shù)據(jù)集往往“體量”龐大、價(jià)格昂貴。
“可復(fù)制性危機(jī)”
雖然Allen博士發(fā)出了這樣的警告,但是根據(jù)她們的說(shuō)法,團(tuán)隊(duì)所提出的答案可能不完全是正確的:
因?yàn)檐浖R(shí)別的模式只存在于數(shù)據(jù)集中,而不存在于現(xiàn)實(shí)世界中。
Allen博士表示,有缺陷的機(jī)器學(xué)習(xí)正在制造一場(chǎng)“科學(xué)危機(jī)”
Allen博士說(shuō):
通常情況下,先使用機(jī)器學(xué)習(xí)技術(shù)并產(chǎn)生了一定結(jié)果的研究,往往不會(huì)發(fā)現(xiàn)它是錯(cuò)誤的。
直到其他人在將這些技術(shù)應(yīng)用于更大的數(shù)據(jù)集中,然后產(chǎn)生的結(jié)果與前人的結(jié)果完全不同,這時(shí)人們才會(huì)驚呼:“天哪!這兩項(xiàng)實(shí)驗(yàn)結(jié)果完全不一致!”
目前,科學(xué)界普遍承認(rèn)存在可復(fù)制性危機(jī)。我敢說(shuō),其中很大一部分原因確實(shí)來(lái)機(jī)器學(xué)習(xí)技術(shù)在科學(xué)研究中的使用。
科學(xué)上的“可復(fù)制性危機(jī)”指的是當(dāng)另一組科學(xué)家嘗試同樣的實(shí)驗(yàn)時(shí),研究結(jié)果沒有被重復(fù)。這意味著最初的結(jié)果是錯(cuò)誤的。一項(xiàng)分析表明,世界上85%的生物醫(yī)學(xué)研究都是徒勞的。
這是一場(chǎng)已經(jīng)持續(xù)了20年的危機(jī)。
這場(chǎng)危機(jī)之所以會(huì)出現(xiàn),是因?yàn)閷?shí)驗(yàn)的設(shè)計(jì)不夠完美,無(wú)法確??茖W(xué)家們不會(huì)自欺欺人——只想得到自己想要的結(jié)果。
具有缺陷的模式
Allen博士表示,機(jī)器學(xué)習(xí)系統(tǒng)和大數(shù)據(jù)集的使用加速了這場(chǎng)危機(jī)。
這是因?yàn)闄C(jī)器學(xué)習(xí)算法專門用于在數(shù)據(jù)集中查找“有趣”的東西。因此當(dāng)它們搜索大量數(shù)據(jù)時(shí),將不可避免地找到一種模式。
真正的挑戰(zhàn)在于,我們真的可以相信這些“發(fā)現(xiàn)”嗎?
那些所謂的科學(xué)發(fā)現(xiàn),能夠代表真正的科學(xué)嗎?它們是可重復(fù)的嗎?若是給定一個(gè)額外的數(shù)據(jù)集,運(yùn)用同樣的方法,是否會(huì)得到相同的結(jié)果呢?不幸的是,事實(shí)往往并非如此。
機(jī)器學(xué)習(xí)也應(yīng)用于生物醫(yī)學(xué)研究
Allen博士正與休斯頓貝勒醫(yī)學(xué)院的一組生物醫(yī)學(xué)研究人員合作,以提高他們研究結(jié)果的可靠性。
她正在開發(fā)下一代機(jī)器學(xué)習(xí)和統(tǒng)計(jì)技術(shù),這些技術(shù)不僅可以篩選大量數(shù)據(jù)進(jìn)行“發(fā)現(xiàn)”,還可以報(bào)告結(jié)果的不確定性及其可能的重復(fù)性。
她告訴與其共事的科學(xué)家:“收集這些數(shù)據(jù)集是非常昂貴的,論文的發(fā)表可能會(huì)需要更長(zhǎng)的時(shí)間,但是你們的成果是能夠經(jīng)得起時(shí)間的考驗(yàn)的!”
“這將為科學(xué)家節(jié)省資金。更重要的是,可以保障科學(xué)不會(huì)按著這些錯(cuò)誤的方向發(fā)展?!?/p>
-
算法
+關(guān)注
關(guān)注
23文章
4700瀏覽量
94787 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8492瀏覽量
134122 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1223瀏覽量
25283
原文標(biāo)題:機(jī)器學(xué)習(xí)正在導(dǎo)致“科學(xué)危機(jī)”
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
“石墨烯電池”是一場(chǎng)騙局?
上周在帝都召開了一場(chǎng)世界機(jī)器人大會(huì),原來(lái)的機(jī)器人都長(zhǎng)這樣的!
@王者解#¥一場(chǎng)歡喜忽非辛,雅五開始來(lái)交往
~~陳晨@東沖西突擴(kuò)領(lǐng)地,猿猴取月一場(chǎng)空。【野外備戰(zhàn) 】
~~吃雞~~東沖西突擴(kuò)領(lǐng)地,猿猴取月一場(chǎng)空?!疽巴鈧鋺?zhàn) 】
虛擬儀器是測(cè)試領(lǐng)域的一場(chǎng)革命嗎
分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)最熱語(yǔ)言_Python
Airbnb機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)經(jīng)驗(yàn)分享
機(jī)器學(xué)習(xí)和人工智能的發(fā)展 正在讓移動(dòng)廣告業(yè)發(fā)生一場(chǎng)重大變革
機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)其實(shí)是一場(chǎng)數(shù)據(jù)上的競(jìng)爭(zhēng)
機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué)的區(qū)別
服務(wù)機(jī)器人為觀眾帶來(lái)了一場(chǎng)最新科技應(yīng)用的集中展示
一場(chǎng)關(guān)于智能制造的盛宴已經(jīng)開啟
一場(chǎng)精彩記憶游戲開源分享

評(píng)論