AlphaGo和AlphaZero又有新兄弟,這次輪到科學(xué)家驚呆了。
DeepMind近日宣布,過去兩年一直在研發(fā)AlphaFold:一個(gè)用人工智能加速科學(xué)發(fā)現(xiàn)的系統(tǒng)。
它僅僅基于蛋白質(zhì)的基因序列,就能預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu),而且結(jié)果比以前的任何模型都要精確。
在“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)奧運(yùn)會(huì)”CASP比賽中,力壓其他97個(gè)參賽者。《衛(wèi)報(bào)》報(bào)道稱,AlphaFold預(yù)測(cè)出了43種蛋白質(zhì)中25種蛋白質(zhì)的最精確結(jié)構(gòu)。在同一類別中排名第二的隊(duì)伍,只預(yù)測(cè)出了3種。
△競(jìng)賽結(jié)果,谷歌為G043
相關(guān)的研究者紛紛表示,DeepMind厲害!很想知道他們方法的細(xì)節(jié)。
對(duì)于這項(xiàng)研究,DeepMind稱其為“DeepMind在科學(xué)發(fā)現(xiàn)領(lǐng)域的第一個(gè)重要里程碑”,在生物學(xué)的核心挑戰(zhàn)之一上取得了重大進(jìn)展。
《衛(wèi)報(bào)》評(píng)論稱,這將“開啟醫(yī)學(xué)進(jìn)步的新時(shí)代”。
到底是個(gè)多大的進(jìn)展?
任何給定的蛋白質(zhì)能做什么,取決于它獨(dú)特的3D結(jié)構(gòu)。 所以,能精確預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu)意義非凡。
首先,它能夠幫助科學(xué)家更好地理解蛋白質(zhì)在人體內(nèi)的作用。對(duì)于診斷和治療由蛋白質(zhì)錯(cuò)誤折疊引起的疾病,比如阿爾茨海默氏癥、帕金森氏癥、亨廷頓氏癥等,至關(guān)重要。
其次,它會(huì)提高我們對(duì)身體及其工作原理的認(rèn)識(shí),使科學(xué)家能夠更有效地設(shè)計(jì)新的、有效的疾病治療方法。
隨著我們通過模擬和模型獲得更多關(guān)于蛋白質(zhì)形狀和它們?nèi)绾芜\(yùn)作的知識(shí),會(huì)使藥物開發(fā)方面更容易,同時(shí)也會(huì)降低相關(guān)的實(shí)驗(yàn)成本。
第三,它也有助于更好地設(shè)計(jì)蛋白質(zhì),一個(gè)例子是,可以推動(dòng)可生物降解酶的進(jìn)步,幫助我們控制像塑料和石油這樣的污染物。
事實(shí)上,研究人員已經(jīng)開始對(duì)細(xì)菌進(jìn)行工程改造,使其分泌蛋白質(zhì),讓廢物可生物降解,進(jìn)而變得更容易處理。
不過,僅僅根據(jù)基因序列來(lái)確定蛋白質(zhì)的3D形狀是一項(xiàng)復(fù)雜的任務(wù)。
挑戰(zhàn)在于,基因序列中只包含蛋白質(zhì)組成部分氨基酸殘基的序列信息,這些氨基酸殘基會(huì)形成長(zhǎng)鏈。 預(yù)測(cè)這些長(zhǎng)鏈如何折疊成復(fù)雜的3D結(jié)構(gòu),被稱為“蛋白質(zhì)折疊問題”(protein folding problem)。
蛋白質(zhì)越大,氨基酸之間的相互作用越多,建模也就更復(fù)雜,困難度也會(huì)成倍上升。正如利文索爾佯謬(Levinthal’s paradox)中指出的那樣,在找到一個(gè)蛋白質(zhì)正確的3D結(jié)構(gòu)之前,要列舉一個(gè)典型的蛋白質(zhì)所有可能的構(gòu)型,需要的時(shí)間比宇宙存在的時(shí)間還要長(zhǎng)。
那么,DeepMind解決這個(gè)問題的思路是怎樣的呢?
DeepMind方案:基于深度神經(jīng)網(wǎng)絡(luò)
DeepMind表示,他們專注于從零開始模擬目標(biāo)形狀,而不是使用以前解決的蛋白質(zhì)作為模板。
因此,在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的物理性質(zhì)方面,DeepMind達(dá)到了非常高的準(zhǔn)確性,然后使用兩種不同的方法,來(lái)構(gòu)建完整的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。
這兩種方法都依賴深度神經(jīng)網(wǎng)絡(luò),需要訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)從基因序列中預(yù)測(cè)蛋白質(zhì)的兩種特性:
1) 成對(duì)的氨基酸之間的距離;
2) 連接這些氨基酸的化學(xué)鍵之間的角度。
具體的操作步驟為:
訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)蛋白質(zhì)中每對(duì)殘基之間的距離分布。然后,將這些概率組合成一個(gè)分?jǐn)?shù),用來(lái)估計(jì)一個(gè)蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度。
此外,DeepMind還訓(xùn)練了一個(gè)單獨(dú)的神經(jīng)網(wǎng)絡(luò),基于所有距離的總和來(lái)評(píng)估初步給出的蛋白質(zhì)結(jié)構(gòu)與正確答案的接近程度。
然后,基于這些評(píng)分函數(shù),去找到符合預(yù)測(cè)的結(jié)構(gòu)。
DeepMind使用的第一種方法,基于結(jié)構(gòu)生物學(xué)中常用的技術(shù),用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)的片段,他們訓(xùn)練了一個(gè)生成神經(jīng)網(wǎng)絡(luò)來(lái)發(fā)明新的片段,用來(lái)不斷提高蛋白質(zhì)結(jié)構(gòu)的評(píng)分。
第二種方法是通過梯度下降法優(yōu)化得分,這是機(jī)器學(xué)習(xí)中常用的一種數(shù)學(xué)技術(shù),可以進(jìn)行小的、增量的改進(jìn),從而得到高精度的結(jié)構(gòu)。
他們將這項(xiàng)技術(shù)應(yīng)用于整個(gè)蛋白質(zhì)鏈,而不是那些在組裝前必須單獨(dú)折疊的片段,從而減少了預(yù)測(cè)過程的復(fù)雜性。
還有“一噸”多的想法
DeepMind的目標(biāo),是將AlphaFold打造成基礎(chǔ)科學(xué)領(lǐng)域的AlphaGo和AlphaZero。他們表示,
我們首次涉足蛋白質(zhì)折疊領(lǐng)域的成功表明,機(jī)器學(xué)習(xí)系統(tǒng)可以整合各種信息來(lái)源,幫助科學(xué)家快速找到復(fù)雜問題的創(chuàng)造性解決方案。
正如我們已經(jīng)看到人工智能如何通過AlphaGo和AlphaZero等系統(tǒng)幫助人們掌握復(fù)雜的游戲一樣,我們同樣希望有一天,人工智能的突破也將幫助我們掌握基礎(chǔ)的科學(xué)問題。
DeepMind的首席執(zhí)行官Demis Hassabis對(duì)此信心滿滿。
“我們還沒有完全解決蛋白質(zhì)折疊問題,這只是第一步,”他說(shuō)。“這是一個(gè)極具挑戰(zhàn)性的問題,但是我們有一個(gè)良好的體系,我們還有’一噸’多的想法還沒有實(shí)施。”
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4806瀏覽量
102688 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
11343
原文標(biāo)題:谷歌DeepMind再一次擊敗人類!這一次AI 成功預(yù)測(cè)蛋白質(zhì)3D結(jié)構(gòu)!AlphaGo有了新兄弟!
文章出處:【微信號(hào):FPGAer_Club,微信公眾號(hào):FPGAer俱樂部】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

評(píng)論