蛋白質結構預測一直是“21世紀的生物物理學”最重要的課題之一,北京昌平實驗室聯合伙伴基于全場景AI框架“昇思MINDSPORE”開發的蛋白質結構預測模型在CAMEO競賽拿下第一并霸榜四周,填補了中國AI基礎軟硬件在蛋白質結構預測領域成績的空白。
國家實驗室是國家組織開展基礎研究和應用基礎研究、培養優秀科技人才、開展高水平學術交流、具備先進科研裝備的重要科技創新基地,是國家創新體系的重要組成部分。經過30多年的建設發展,已成為孕育重大原始創新、推動學科發展和解決國家戰略重大科學技術問題的重要力量。
沐光而行
打造世界一流生命科學創新高地
2020年10月24日,昌平實驗室正式掛牌成立。昌平實驗室聚焦生命科學原始創新和國家重大需求,開展戰略性、前瞻性、基礎性科學技術研究,其關鍵科學任務和重點布局包括新發突發及重大傳染病、腦科學與腦疾病、前沿技術與基礎研究、人工智能與生物醫藥等,力爭打造世界一流生命科學創新高地。
踏上征程,追尋中國版AlphaFold
近半個世紀以來,蛋白質結構預測一直被譽為“21世紀的生物物理學”最重要的課題之一。蛋白質在分子生物學的中心法則中具有十分重要的地位,在各種生命過程中不可或缺。蛋白質的功能多樣性歸因于它們能夠從線性高分子形狀折疊成獨特而多樣的三維結構形態,在阿爾茨海默病中它們會折疊和聚集,在囊性纖維化中它們會進入細胞中錯誤的空間,這些僅是眾多致病機制中的一小部分。因此,準確、快速的蛋白質結構預測不僅可以在學術研究領域幫助科學家 快速獲得或驗證關鍵蛋白結構,促進人們對重要生命過程中分子機理的理解,而且可以在醫療健康和生物工程領域作為有利工具,引發藥物靶點發現和功能蛋白設計等。
蛋白質構象數量巨大,計算過程十分復雜,通過AI對蛋白質結構進行預測一直未能取得實質性突破,獲取蛋白質空間結構的方法仍以傳統的實驗室手段為主,如X-ray、核磁共振和冷凍電鏡等,單個蛋白質的觀測成本高達數月及數百萬人民幣,而且無法預測精確的三維結構,很難直接通過它們去探索整個“蛋白質宇宙”。
2020年,谷歌DeepMind團隊發布了基于人工智能的蛋白質結構預測工具AlphaFold2。AlphaFold2僅通過氨基酸序列就能以前所未有的準確度預測蛋白質三維結構,彌補了傳統蛋白質結構預測方法一直存在的計算精度不足的缺陷,開啟了計算生物學的新時代。自此,我國學術界也踏上追尋中國版AlphaFold的道路,這條路雖布滿荊棘,但也終會迎來突破與創新。
乘風破浪,依托昇騰AI打造蛋白結構預測工具
昌平實驗室著眼于解決國家乃至全人類面臨的重大挑戰,率先扛起大旗,選擇與北京大學、深圳灣實驗室以及華為共同合作,在中國算力網智算網絡關鍵節點“西安雁塔人工智能創新發展中心”的昇騰AI強大算力支持下,在全場景AI框架昇思MindSpore上推出了全流程蛋白質結構預測工具MEGA-Protein。
MEGA-Protein包含AI MSA引擎、蛋白質折疊訓練推理流程、蛋白質結構打分、蛋白質結構預測數據集PSP等關鍵技術。該方案通過借助華為智算與實驗室行業解決方案中的異構計算架構CANN( Compute Architecture for Neural Network)釋放昇騰AI的澎拜算力,借助軟硬件協同優化大大提高了蛋白質預測的計算效率;還能夠在MSA少樣本甚至零樣本的情況下,幫助AlphaFold2維持甚至提高推理精度,突破在“孤兒序列”、“高異序列”和人造蛋白等MSA匱乏場景下無法做出準確預測的限制。
參考DeepMind于2021年7月份開源的蛋白質結構預測模型Alpha Fold2,本次開源的蛋白質結構預測推理工具模型部分與其相同,在多序列比對階段,采用了MMseqs2進行序列檢索,相比于原版算法端到端運算速度有2-3倍的提升,混合精度下,單步迭代由20秒縮短至12秒,性能提升 超過60%。訓練長度由384提升至512。
CAMEO競賽(Continous Automated Model Evaluation)是全球蛋白質結構預測領域最權威的比賽之一。2022年4月,基于全場景AI框架昇思Mindspore開發的蛋白質結構預測模型在CAMEO拿下競賽第一,并連續霸榜四周!
步履不停,科技強國
這款基于昇騰AI的蛋白結構預測工具的出現不僅填補了中國AI基礎軟硬件在蛋白質結構預測領域成績空白,還大大降低了廣大生物醫療實驗工作者的使用門檻,后續也將為 生物蛋白質領域的基礎研究與應用工作提供持續助力。昇思MindSpore首席架構師金雪鋒評論稱:“該工作是產學界合作的一次重大成功實踐,也是科學計算與人工智能結合潛力的展示。支持多計算范式的MindSpore能夠有效提高科研工作的生產力,大幅度提升科學計算場景的性能。”
自從合作以來,除了“蛋白質結構預測”工具的聯創,昌平實驗室與華為持續在其它多個項目取得突破性成果。而在未來,也必將有更多學術科研界合作伙伴牽手華為,用創新ICT技術共同推進基礎研究與應用研究融通發展,為建設世界科技強國提供有力支撐。
-
華為
+關注
關注
216文章
35006瀏覽量
254921 -
AI
+關注
關注
87文章
34063瀏覽量
275189 -
預測模型
+關注
關注
0文章
27瀏覽量
8891
原文標題:全球競賽第一昌平實驗室蛋白質結構預測模型霸榜四周
文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數字中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
2025邊緣AI預測:昇騰310B邊緣將占工業推理市場35%的三大動因

(原創)昇騰310B(8T/20T)算力主板定制方案
2025昇騰AI開發者創享日浙江站成功舉辦,現場演示OrangePi AIpro(20T)部署DeepSeek模型開發全流程

迅龍軟件出席華為昇騰APN伙伴大會,獲昇騰APN鉆石伙伴授牌及兩項大獎

喜訊 英碼科技受邀出席華為昇騰APN伙伴大會,正式成為「昇騰鉆石部件伙伴」,喜獲多個重磅獎項!

評論