在NVIDIA和Scripps Research的幫助下,橡樹嶺國家實(shí)驗(yàn)室研究人員使用Summit超級計算機(jī)將搜索時間從數(shù)年縮短至數(shù)小時。
正在家中遠(yuǎn)程辦公的Ada Sedova,有時甚至穿著睡衣。她利用世界上功能最強(qiáng)大的超級計算機(jī)來尋找一個微小的分子,這種分子可以阻止人們感染新型冠狀病毒。
橡樹嶺國家實(shí)驗(yàn)室(Oak Ridge National Laboratory)的生物物理學(xué)研究員Sedova表示:“我比以往任何時候都做得更多。出于對大流行的擔(dān)憂,我將許多私人時間投入到這項工作中。”
通過她的辛勤付出,團(tuán)隊最終在短短24小時內(nèi)執(zhí)行了20億次分子測試。
Sedova在尋求一個配位體,它是一種體積小于幾十個原子的有機(jī)分子。合適的配位體會將自身與冠狀病毒的蛋白質(zhì)結(jié)合,從而阻止其感染健康細(xì)胞。
但問題在于,要檢查的配位體和蛋白質(zhì)數(shù)量非常龐大,且它們的形狀會隨著原子力的變化不斷改變。在數(shù)十億種可能的化合物中找到合適的配位體仿佛大海撈針。
在濕實(shí)驗(yàn)室(用于開展基于實(shí)驗(yàn)藥劑的傳統(tǒng)實(shí)驗(yàn)的實(shí)驗(yàn)室)中將全部可能性嘗試一遍需要若干年的時間, 即使通過ORNL的超級計算機(jī)Summit上的9,216個CPU上將它們?nèi)?a target="_blank">仿真,也需要四年時間才能完成。因此Sedova和她的同事們選擇裝備了27,648組NVIDIA GPU的 Summit超級計算機(jī)來加快工作速度。
他們最初使用的是AutoDock的OpenCL版本,這是一個用來模擬蛋白質(zhì)和配體如何結(jié)合的開源程序,由斯克里普斯研究所和達(dá)姆施塔特大學(xué)合作開發(fā)。與CPU相比,運(yùn)行在GPU上的OpenCL版本的處理速度提高了50倍。
CUDA切入正題
在NVIDIA和Scripps Research的幫助下,該團(tuán)隊將代碼移植到CUDA,使其可以在Summit上運(yùn)行,由此在原有50倍加速的基礎(chǔ)上,處理速度再次提升2.8倍。Jubilee Development的另一位研究人員Aaron Scheinberg發(fā)現(xiàn),在使用OpenMP加速向GPU提供數(shù)據(jù)時,這項工作又實(shí)現(xiàn)了3倍增速。
對抗某一特定蛋白質(zhì)的化合物數(shù)量可達(dá)14億種,另一項測試結(jié)果表明,他們可以在短短12小時內(nèi)完成對這些化合物的高精度篩選。與運(yùn)行在CPU上的程序相比,該速度提高了33倍以上。
GPU將處理包含14億個配位體的數(shù)據(jù)庫所需的時間減少了一個數(shù)量級以上, 他們還縮小了結(jié)果間差異,由此解決了在超級計算機(jī)的CPU上的進(jìn)程安排問題。
她說:“GPU與Summit規(guī)模和體系結(jié)構(gòu)的結(jié)合,將化合物對接能力擴(kuò)充了數(shù)十億個。”
團(tuán)隊的另一位成員,生物物理學(xué)家Josh Vermaas特別對NVIDIA團(tuán)隊的Scott Le Grand幫助他們將AutoDock移植到CUDA表示感謝。Vermaas在關(guān)于工作開端的博客中寫到, “以前的平臺只支持OpenCL代碼,他的幫助對實(shí)現(xiàn)平臺性能提升至關(guān)重要。”
在24小時內(nèi)模擬20億種化合物
Sedova相信,通過進(jìn)一步改進(jìn),團(tuán)隊可以實(shí)現(xiàn)將化合物檢測能力提升至24小時內(nèi)20億種。對于數(shù)目如此龐大的數(shù)據(jù),這將是在高分辨率下完成的首次模擬。
研究人員在實(shí)現(xiàn)這一里程碑式的成就過程中仍然面臨一些挑戰(zhàn)。
蛋白質(zhì)-配位體對接的標(biāo)準(zhǔn)工作流程是一個緩慢的基于文件的流程。它可以在筆記本電腦上完成對數(shù)百種化合物的測試,但如此龐大的數(shù)據(jù)量即使交由世界上最大的超級計算機(jī)處理,計算機(jī)也會出現(xiàn)宕機(jī)的情況。
這是對那些希望幫助加速科學(xué)發(fā)展的開源開發(fā)者的號召。
Sedova的團(tuán)隊正在領(lǐng)導(dǎo)這項工作,組建了一個新的工作流程,該工作流程有望安全地在Summit上啟動大量工作。她正在咨詢系統(tǒng)的I / O專家,并試圖建立一個數(shù)據(jù)庫來容納所有配體。
下一步是在Summit的4,608個節(jié)點(diǎn)中的108個上啟動約100萬種化合物的實(shí)驗(yàn)。她說:“如果行得通,我們將在Summit的所有節(jié)點(diǎn)上啟動14億個化合物的大規(guī)模生產(chǎn)。”
聚焦搜索有希望成功的分子
如果該團(tuán)隊成功,他們將向孟菲斯的研究人員發(fā)送一份約9000種最有希望成功的化合物清單,以便在濕實(shí)驗(yàn)室中對真實(shí)的病毒開展測試。搜索范圍的縮小大大增加了配位成功的希望。
這個項目于今年開始,當(dāng)時ORNL的頂級研究人員Jeremy C. Smith展示了使用Summit超級計算機(jī)進(jìn)行藥物研究以對抗冠狀病毒的首個研究。目前項目仍處于初期階段。
展望未來,Sedova就橋接蛋白質(zhì)-配位體領(lǐng)域與高性能計算的典型方法提出了更多想法,她也有足夠的精力去進(jìn)一步探索。
責(zé)任編輯:pj
-
gpu
+關(guān)注
關(guān)注
28文章
4912瀏覽量
130691 -
超級計算機(jī)
+關(guān)注
關(guān)注
2文章
469瀏覽量
42343 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3902瀏覽量
65795
發(fā)布評論請先 登錄
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機(jī)

數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Windows無法啟動MongoDB服務(wù)的數(shù)據(jù)恢復(fù)案例

云數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?
云端超級計算機(jī)使用教程
量子計算機(jī)與普通計算機(jī)工作原理的區(qū)別

數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

評論