2018年,DeepMind的AlphaFold橫空出世,僅憑氨基酸序列就能預測蛋白質的3D結構,一舉攻克了困擾生物學界50年的蛋白質折疊問題。2020年,AlphaFold2的問世被《科學》雜志評為年度突破,其預測的2億多個蛋白質結構幾乎涵蓋了所有已知蛋白質,為研究提供了前所未有的資源庫。
一時間,AI蛋白質解析成為科技界最炙手可熱的話題,被譽為繼AlphaGo之后人工智能在科學領域的又一里程碑。
然而,隨著ChatGPT等大語言模型的崛起,AI蛋白質解析似乎淡出了公眾視野,進入了沉寂期。但這一領域在過去幾年中并未停滯,而是轉向更深入、更實用的發展階段,經歷了一些新變化。
近年來,AI蛋白質解析不再只局限于生物科學,開始向醫藥、環境甚至考古領域延伸。
材料科學領域,AI蛋白質設計正催生全新的生物基材料。傳統材料研發往往依賴試錯和經驗,現在科學家利用AI蛋白質能創造出自然界中不存在的新材料。例如,麻省理工學院研究團隊開發的機器學習算法,能夠設計出具備特定力學特性的新型蛋白質,用于制造可替代石油基或陶瓷材料的生物材料,在保持性能的同時大幅降低碳足跡。
環境保護領域,AI蛋白質工程正為可持續發展提供新方案。造紙、紡織工業依賴酶等蛋白質催化劑,但天然酶往往無法適應高溫、酸堿等極端條件。過去,研究員需要通過反復誘變篩選來改良酶的性能,如今借助AI便可以定向設計蛋白質。上海交通大學的團隊建立了全球最大的蛋白質序列數據庫,他們的技術可以將蛋白質研發周期從傳統的2~5年縮短至6~12個月,大幅降低工業用酶改良的時間和成本。
考古和古生物領域,AI蛋白質解析開始發揮獨特作用。傳統考古主要依賴化石和DNA分析,但蛋白質更具化學穩定性,保存時間更長、能提供的信息更豐富。然而,古代蛋白樣品成分復雜,傳統質譜測序和數據庫比對方法效率有限,AI的引入顯著提升了古蛋白分析能力。劍橋大學的考古學家利用AI蛋白質測序工具在古代巴西陶片中發現了魚類肌肉蛋白的證據,研究了古代居民的飲食結構。可以說,AI讓考古學家讀懂了古人留下的蛋白質密碼,為探索人類歷史提供新視角。
可見,AI蛋白質解析的跨學科融合不僅豐富了各領域的研究手段,也產生了1+1>2的創新效應,在各個學科領域展示了不可替代的獨特價值。
早期的AI蛋白質解析主要停留在學術研究和實驗室階段。如何將這些實驗室突破轉化為實際應用,一直是產業界關注的問題。
預測蛋白質結構只是第一步,要真正用于藥物開發、工業生產,還需要驗證結構的功能、優化設計并實現大規模制備。近年來,這一領域出現了明顯的產學研融合趨勢:學術界、工業界和創業公司緊密合作,形成了“AI設計一自動化實驗驗證一產業落地”的完整鏈條。
首先,AI設計環節,科研突破不斷涌現,并迅速向產業開放。2021年, DeepMind將AlphaFold2模型開源,并與歐洲生物信息研究所合作發布了AlphaFold結構數據庫,公開了超過2億種蛋白質的預測結構。此后,學界和業界研究者在此基礎上開發出各種改進模型和工具。Meta公司推出了可快速預測蛋白質結構的ESMFold;華盛頓大學貝克實驗室開發了RoseTTAFold及其衍生的RFdiffusion模型,用于生成全新的蛋白質結構。開源發布的設計模型,推動形成了開放創新的社區,為全球企業提供了學習研究平臺。
其次,在實驗驗證環節,自動化、高通量技術的發展使大規模測試AI設計的蛋白質成為可能。過去,設計出一個新蛋白往往需要科研人員手工進行基因克隆、表達純化、功能測定,效率低、成本高。如今,借助自動化實驗室和微流控技術,研究人員可以批量合成和測試成百上千種蛋白變體,快速篩選出性能優異的候選。上海交大團隊研制的世界首臺集成自動化裝置,可在24小時內連續完成100多項蛋白表達、純化和功能測試任務,效率比人工提高近十倍。自動化實驗技術的成熟,讓原本繁瑣的實驗流程標準化、規模化,為產學研轉化打通了關鍵一環。
到了產業落地環節,越來越多的AI蛋白質解析技術走出實驗室,進入應用和商業化階段。大型制藥公司、生物技術創業公司甚至傳統工業企業,都開始擁抱AI設計的蛋白質產品。傳統藥物研發中“十年十億美元”的魔咒正在被打破,AI蛋白質設計平臺公司分子之心與藥企依靠AI蛋白質解析,僅用三天就設計出數十個理想的候選蛋白,突破了相關疫苗穩定性專利。上海交大洪亮團隊發布的Venus模型,通過AI定向進化功能,僅用不到一年時間就將金賽藥業單域抗體的耐堿性提升四倍,每年節省上千萬元成本,成為全球首款由大模型設計并規模化生產的蛋白質產品。
可以看到,產學研融合正在加速AI蛋白解析技術的產業化進程。從科研院所的原始創新,到創業公司的產品開發,再到企業的規模化生產和市場推廣,各環節緊密銜接,帶來了顯著的經濟和社會價值。
一方面,AI蛋白質技術正在催生新的產業增長點。市場分析,全球蛋白質工程市場規模預計將從2024年約35億美元增至2030年的近78億美元。AI驅動的創新公司將不斷涌現,吸引大量投資。另一方面,技術應用有望大幅降低傳統行業的成本。例如,通過AI設計的高效酶制劑可以減少工業的能耗和化學廢物排放;AI加速新藥發現有望縮短藥物上市時間、降低研發成本,惠及患者。
AI蛋白質解析的產學研聯動正在將科學創新從少數頂尖實驗室的專屬成果轉變為全社會共享的財富。曾經掌握在頂尖實驗室的技術,借助開源工具和云平臺,已在中小企業乃至個人研究者手中釋放出更大的價值和活力。
過去,AI蛋白質解析領域,美國長期占據主導地位,其他國家以跟隨為主。近幾年,中國團隊的崛起和國際合作的深化,逐漸改變了這一格局,形成中美雙核驅動的新局面。
首先,在基礎算法方面,中國團隊開始提出具有國際影響的新模型和新方法。上海交通大學的團隊建立了全球最大的蛋白質序列數據庫“Venus-Pod”(包含超過90億條序列信息)。基于此訓練出的Venus系列模型,能夠高精度預測和設計蛋白質功能。
其次,在應用和產業化方面,中國擁有全球最大的生物制藥市場和工業酶應用市場。近年來,中國的高校、科研院所與企業緊密合作,推動AI蛋白質技術在醫藥、工業等領域的應用。過去兩年,上海交大團隊利用Venus模型設計的多種新型蛋白,已經進入工業化應用階段。例如,在阿爾茨海默癥早期診斷領域,研究人員利用AI優化的堿性磷酸酶(ALP),能夠檢測到極低濃度的疾病生物標志物,活性已達到市售最好產品的三倍。
此外,中國政府也將生物計算、AI制藥納入重點發展規劃,在資金和政策上予以支持。例如,北京化工大學生命科學與技術學院吳邊教授近期獲批的“基于人工智能的功能蛋白質設計和優化”項目,就鼓勵跨學科團隊攻關AI蛋白質解析關鍵問題。這樣的環境下,中國在該領域的整體實力快速提升,逐漸從跟跑者轉變為并跑者乃至某些方向的領跑者。
除了中美之外,其他國家和地區也在積極參與蛋白質解析領域的研發。德國歐研所(參與AlphaFold數據庫建設) 、加拿大的Vector研究所(參與蛋白質語言模型研究)在蛋白質動力學模擬與AI結合方面都有所貢獻。
可以預見,未來全球在這一領域的合作將更加緊密,跨國界的研究聯盟和數據共享平臺將不斷出現。來自世界各地的研究機構將共同應對諸如蛋白質折疊機制解析、AI模型可靠性提升、倫理安全等全球性問題。
總之,AI蛋白質解析領域正在經歷一場靜水流深的變革。從破解蛋白質結構,到助力研發新藥,該技術已從實驗室走向產業。未來,它可能幫助人類設計攻疾病的精準藥物、創造可降解綠色塑料,甚至合成自然界不存在的蛋白質,帶來更大的社會價值。
審核編輯 黃宇
-
AI
+關注
關注
88文章
35320瀏覽量
280795
發布評論請先 登錄
以色列面向生物傳感器和電路的蛋白質納米線
面向生物傳感器和電路的蛋白質納米線
蛋白質組學技術與藥物作用新靶點研究進展 精選資料分享
點成分享 | 蛋白質濃度測定之BCA法
基于PPI網絡與機器學習的蛋白質功能預測方法
一種改進的動態蛋白質網絡構建算法

評論