前不久,DeepMind放出大招AlphaFold。在“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運(yùn)會(huì)”CASP13比賽中,力壓其他參賽者。
那么,DeepMind這項(xiàng)研究到底意味著什么?會(huì)帶來什么樣的影響?
作為業(yè)內(nèi)人士,哈佛醫(yī)學(xué)院系統(tǒng)生物學(xué)研究員Mohammed AlQuraishi對其進(jìn)行了解讀。他博士畢業(yè)于斯坦福大學(xué),參加了CASP13,是AlphaFold大放異彩的見證者。
他認(rèn)為,AlphaFold有進(jìn)步,但并沒有解決根本的問題。不過,它在生物化學(xué)中最重要的問題之一上取得了重大進(jìn)展,大家應(yīng)該為此感到高興。
此外,AlphaFold推出之后,也引發(fā)了外界的質(zhì)疑,不少人都認(rèn)為這是一個(gè)高超的工程技術(shù),并不能稱得上是一個(gè)基礎(chǔ)的科學(xué)見解。 AlQuraishi認(rèn)為,AlphaFold兩者兼具。
解讀文章發(fā)表之后,引發(fā)了不小的關(guān)注。不少業(yè)內(nèi)人士發(fā)表評論稱,這是目前關(guān)于AlphaFold的最好的一篇解讀。
AlphaFold有進(jìn)步,但沒有解決根本問題
從AlphaFold給CASP成績帶來的提升來看,的確是取得了進(jìn)步。但這個(gè)進(jìn)步,是學(xué)術(shù)研究的自然增長,還是AlphaFold依靠自身能力帶來的呢?這是一個(gè)非常容易忽視、且容易引發(fā)分歧的問題。
上圖中,呈現(xiàn)了每屆CASP第一名和第二名的成績,虛線代表著CASP13預(yù)期成績,是根據(jù)CASP10到12的平均改善率預(yù)測的。
在CASP 10之前,整個(gè)增長曲線10年來基本上是平緩的。CASP11的提升,是因?yàn)橐肓藚f(xié)同進(jìn)化的方法。CASP 12帶來的提升,是這些方法最終被證明了。即使沒有AlphaFold,CASP13的成績,也會(huì)因?yàn)樵趨f(xié)同進(jìn)化方法中廣泛應(yīng)用深度學(xué)習(xí),出現(xiàn)進(jìn)一步的提升。
AlphaFold的意義,在于取得了更大幅度的提升。從圖中可以看出,第二好的方法,基本上和預(yù)計(jì)的差不多,而AlphaFold又在這個(gè)基礎(chǔ)上提升了不少。
因此,可以說AlphaFold取得了實(shí)質(zhì)性進(jìn)展。
但這是否就意味著問題已經(jīng)解決了,或者說解決得差不多了呢?答案依舊是否定的。 AlQuraishi表示,AlphaFold的技術(shù)還沒有到達(dá)那一步。
如果按照AlphaFold這樣的發(fā)展勢頭,四年內(nèi)就能夠達(dá)到真正解決問題的地步。當(dāng)然,這是以發(fā)展勢頭能夠持續(xù)為前提的。但如果沒有新的概念突破,就沒有任何理由能夠證明,這個(gè)勢頭是可持續(xù)的。
一個(gè)有趣的假設(shè)是,如果其他有一個(gè)學(xué)術(shù)團(tuán)體取得了與DeepMind相同的成果,會(huì)不會(huì)引發(fā)同樣大的關(guān)注?答案當(dāng)然是否定的。從CASP11→ CASP12的進(jìn)步中就證明了這一點(diǎn),當(dāng)時(shí)的進(jìn)步并不比這一次差,但新聞報(bào)道寥寥無幾。
毫無疑問,DeepMind的影響力與受關(guān)注度,發(fā)揮了很大的作用,當(dāng)然,這對整個(gè)領(lǐng)域的發(fā)展也有很大的幫助。
此外,AlQuraishi認(rèn)為人們對DeepMind帶來的進(jìn)步過于樂觀了,這是他們第一次進(jìn)入這個(gè)領(lǐng)域,優(yōu)秀的工程附加價(jià)值可能不會(huì)重復(fù)出現(xiàn)。
但不論如何,DeepMind都給當(dāng)前的研究格局帶來了極大的沖擊。AlphaFold推出之后,CASP13上討論最多的一個(gè)問題就是,這是學(xué)科基礎(chǔ)的突破,還是DeepMind依賴高超的工程技術(shù)帶來的突破?
學(xué)科基礎(chǔ)的突破還是高超的工程技術(shù)?
AlQuraishi認(rèn)為,這個(gè)問題非常愚蠢,而且也會(huì)引起分歧。如果非要回答這個(gè)問題的話,兩者兼有。
從學(xué)科基礎(chǔ)突破方面來看,DeepMind有很多不錯(cuò)的想法。
首先,他們不僅預(yù)測了這些氨基酸的化學(xué)鍵之間連接的角度與相互作用,還預(yù)測了成對的氨基酸之間的距離。
雖然說之前也有學(xué)者采用了相同的方法,但多重跡象表明,兩個(gè)團(tuán)隊(duì)是獨(dú)立發(fā)展出這個(gè)想法的。至關(guān)重要的是,AlphaFold還進(jìn)一步預(yù)測了距離分布。根據(jù)DeepMind官方博客的信息:
他們訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)來預(yù)測蛋白質(zhì)中每對殘基之間的距離分布。然后,將這些概率組合成一個(gè)分?jǐn)?shù),用來估計(jì)一個(gè)蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度,又另外訓(xùn)練了一個(gè)單獨(dú)的神經(jīng)網(wǎng)絡(luò),基于所有距離的總和來評估初步給出的蛋白質(zhì)結(jié)構(gòu)與正確答案的接近程度。
其次,AlphaFold在進(jìn)一步預(yù)測蛋白質(zhì)結(jié)構(gòu)的時(shí)候,還運(yùn)用到了勢函數(shù)相關(guān)的知識。根據(jù)參考狀態(tài),把用神經(jīng)網(wǎng)絡(luò)生成的勢函數(shù)中的勢進(jìn)行歸一化。再用另一個(gè)獨(dú)立運(yùn)行的算法把它最小化,進(jìn)而生成蛋白質(zhì)折疊。
雖然這些想法看上去非常簡單,但科學(xué)不就是用簡單的想法產(chǎn)生深遠(yuǎn)的影響嗎?
當(dāng)然,DeepMind也利用了他們在機(jī)器學(xué)習(xí)方面深厚的專業(yè)知識。例如,分布預(yù)測的想法與他們在一年前發(fā)表的關(guān)于分布強(qiáng)化學(xué)習(xí)的論文有點(diǎn)相似。
這對AlphaFold有沒有影響不得而知。但可以確定的是,機(jī)器學(xué)習(xí)和蛋白質(zhì)兩個(gè)領(lǐng)域的專業(yè)知識結(jié)合對于實(shí)現(xiàn)這些進(jìn)步有很大的幫助。
在工程方面自是不消多說,現(xiàn)在大家看到的任何“優(yōu)雅”的解決方案,都是多次試錯(cuò)的結(jié)果,這很大程度上取決于計(jì)算能力和人力資源。
學(xué)術(shù)團(tuán)體的危機(jī):到底發(fā)生了什么?未來怎么辦?
很多相關(guān)的研究學(xué)者,尤其是參加CASP13的學(xué)者,看到DeepMind的研究成果,都有一種存在主義的焦慮感。
非常具有諷刺意義的是,這些學(xué)者的目標(biāo)就是要淘汰蛋白質(zhì)晶體研究者,現(xiàn)在也在擔(dān)心自己被淘汰。
AlQuraishi認(rèn)為,大多數(shù)人都經(jīng)歷了以下的幾個(gè)階段:
一開始,擔(dān)心DeepMind團(tuán)隊(duì)?wèi){借著一些卓越的洞察力,加上頂尖的工程技術(shù),超越了我們所有人;
然后,看到他們的見解與大多數(shù)人的想法并沒有太多的不同,就松了一口氣;
進(jìn)而開始貶低DeepMind的貢獻(xiàn),并將其取得的成功,歸功于Alphabet掌握的資源。
撇開上述觀點(diǎn)的有效性不談,他們潛在的擔(dān)憂是,蛋白質(zhì)結(jié)構(gòu)預(yù)測作為一個(gè)學(xué)術(shù)領(lǐng)域,是否會(huì)像機(jī)器學(xué)習(xí)一樣,最好的研究將會(huì)在工業(yè)界的實(shí)驗(yàn)室中誕生,而學(xué)術(shù)團(tuán)體只能夠分食剩下的殘?jiān)?/p>
說實(shí)話,這個(gè)問題沒有答案。這個(gè)設(shè)想也是未來可能出現(xiàn)的情景。隨著DeepMind的加入,學(xué)術(shù)界的研究者這不得不考慮這一點(diǎn)。
關(guān)鍵是,學(xué)術(shù)研究團(tuán)體,是否應(yīng)該就此放棄他們的蛋白質(zhì)結(jié)構(gòu)研究項(xiàng)目,轉(zhuǎn)向其他領(lǐng)域?換了新的領(lǐng)域,是不是還會(huì)有其他的科技公司進(jìn)入,繼續(xù)壓迫他們的研究空間?就這些問題,AlQuraishi給出了自己的一些想法。
最重要的一點(diǎn)是,應(yīng)該意識到DeepMind的進(jìn)入,是一件不可預(yù)測的好事。推動(dòng)了整個(gè)科學(xué)界在生物化學(xué)最重要的問題上取得了重大進(jìn)展。是誰取得了進(jìn)展不重要,重要的是取得了進(jìn)展。
而且,DeepMind的進(jìn)入也表明了現(xiàn)在有了新的、世界一流的研究團(tuán)隊(duì)在這個(gè)領(lǐng)域投入資源,并于現(xiàn)有最優(yōu)秀的團(tuán)隊(duì)進(jìn)行競爭。如果這樣的情況每十年發(fā)生一次,我們應(yīng)該張開雙臂歡迎。
我們也應(yīng)該鼓勵(lì)他們像學(xué)術(shù)團(tuán)體一樣,公開分享他們的研究成果,學(xué)術(shù)團(tuán)體也可以像他們學(xué)習(xí)如何改進(jìn)工程實(shí)踐。
更何況,DeepMind也提高了蛋白質(zhì)結(jié)構(gòu)問題的知名度,也會(huì)激勵(lì)大量的人們進(jìn)入這個(gè)領(lǐng)域。
面對DeepMind,最好的方法,就是的適應(yīng)。就像人工智能領(lǐng)域一樣,學(xué)術(shù)團(tuán)體應(yīng)該把目光放在對資源要求較低,需要關(guān)鍵概念突破才能帶來進(jìn)展的問題上。就蛋白質(zhì)結(jié)構(gòu)預(yù)測而言,這是一個(gè)多重的問題,真正解決這個(gè)問題,需要協(xié)同的方法。
此外,AlQuraishi也透露了DeepMind在AlphaFold上后續(xù)的動(dòng)向,并表達(dá)了自己看法:
DeepMind已經(jīng)承諾了要發(fā)表一篇關(guān)于AlphaFold的論文,最終和確切的描述還要看他們的論文。不過,他們并沒有發(fā)布源代碼的計(jì)劃,短期內(nèi)也不太可能建立一個(gè)公開的預(yù)測服務(wù)器。
話雖如此,但他們在CASP13期間樂于討論他們的方法,并且似乎真的有興趣與社區(qū)分享這種方法,并希望其他學(xué)者能夠在此基礎(chǔ)上進(jìn)一步發(fā)展。我的感覺是,他們是為了科學(xué)。
你怎么看?
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5554瀏覽量
122430 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
11327
原文標(biāo)題:哈佛醫(yī)學(xué)院研究員解讀DeepMind大突破AlphaFold:有進(jìn)步,但未解決根本問題
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
在stm32中系統(tǒng)時(shí)鐘到底意味著什么???
FPGA的底板尺寸意味著什么
請問CARTIAN在函數(shù)CysLysIsStValualValuy中意味著什么?
新表中的變量變成紅色意味著什么?
請問端點(diǎn)是否意味著延遲?
系統(tǒng)最可靠意味著什么,如何實(shí)現(xiàn)?

5G到底意味著什么?它能顛覆時(shí)代?
電信聯(lián)通的合并到底意味著什么?
互聯(lián)網(wǎng)存款產(chǎn)品下架意味著什么?
編程中的同步和異步意味著什么?

鴻蒙開源意味著什么
耦合到底意味著什么

評論