麻省理工學院的三位材料科學家及其同事發表的論文中,描述其 AI系統可通過科學論文和提取“食譜”合成特定類型的材料。
2017年11月,美國麻省理工學院的三位材料科學家及其同事發表論文,描述了一種新的人工智能系統,可鉆研科學論文并提取“配方”,合成特定類型的材料。
這一工作被看做向為僅理論描述的材料生成配方的系統邁出的第一步。現在,在《計算材料學》(Computational Materials)期刊發表的一篇論文中,這三位材料科學家聯合麻省理工學院電機工程與計算機科學系(EECS)的一位同事將這項工作繼續往前推進,提出了一種新的人工智能系統,可以識別與配方一致的更高水平特征。例如,該新系統能確定材料配方中所用的“前體”化學物與得到產品的晶體結構之間的關系。后來發現,在文獻中已記錄了相同的關系。
該系統還依賴于提供了產生原始配方自然機制的統計學方法。在論文中,研究人員利用該機制為已知材料提出了不同的配方,且這些建議配方與真正的配方一致。
與過去10年很多表現頗佳的人工智能系統一樣,麻省理工學院研究人員的這個新系統是所謂的神經網絡,通過分析大量的訓練集來學習執行計算任務。傳統而言,利用神經網絡生成材料配方的努力要解決兩大問題,研究人員將其描述為稀疏與稀少。材料的配方可被表示成矢量,通常是一長串數字。每個數字代表著配方的一個特征,例如某種化學品的濃度、溶解它的溶劑、或者發生反應的溫度。
由于任何制定的配方都只會用到文獻中描述的各類化學品和溶劑的其中幾種,所以大多數數字為零。這就是研究人員所謂的“稀疏”。類似地,要學習改變反應參數——例如化學濃度和溫度——如何會影響最終產品,理想情況下系統會接受大量例子的訓練,在這些例子中參數發生了改變。但是,對于有些材料——尤其是較新的材料,文獻可能只含有少量的配方。這就是稀少。“人們認為有了機器學習,我們就需要大量數據,如果數據很稀疏,我們就需要更多的數據。”研究人員說,“如果我們嘗試專注于很具體的系統,我們不得不用到高維數據,但這種數據我們沒有很多,這種情況下,我們還能不能用這些神經機器學習技術呢?”
神經網絡一般按層排布,每一層都包含了數千個簡單處理單元,即節點。每個節點都與上下層的數個節點相連。數據輸入底層,后者操作數據并將其傳送到下一層,然后這層又操作數據并將其傳送到下一層,以此類推。在訓練中,節點之間的連接不斷地調整,直至最后一層的輸出與某些計算的結果大體一致。
稀疏的高維數據存在的問題是,對于任何指定的訓練示例,底層的大多數節點沒有接收數據。這會需要一個相當大的訓練集才能保證整個網絡有足夠的數據來學習進行可靠的歸納。
麻省理工學院研究人員的網絡旨在將輸入矢量精煉成更小的矢量,讓其中所有的數據對于每個輸入都有意義。為了實現這個目標,該網絡有一個節點很少的中間層,在有些實驗中只有2個節點。
訓練的目的很簡單,對網絡進行配置,使得它的輸出與輸入盡可能相近。如果訓練成功,中間層的這些少數節點必須能代表輸入矢量中包含的絕大部分信息,但結構更精簡。這種系統稱為“自動編碼器”,它的輸出努力與輸入相匹配。自動編碼補償了稀疏,但是要處理稀少,研究人員不僅用生產具體材料的配方來訓練網絡,還用生產很相似材料的配方進行訓練。他們利用了三種相似性,其中一種旨在保留晶體結構的前提下將材料之間的不同之處降至最低,例如用一個原子替代另一個原子。在訓練中,網絡提供示例配方的權重根據其的相似性分數而有所不同。
事實上,研究人員的網絡不僅僅是自動編碼器,而是“變分自動編碼器”。這意味著,在訓練中對該網絡的評價不僅僅取決于其輸出與輸入的匹配性有多高,還取決于中間層得到的值與統計學模型的一致性有多高,例如我們熟悉的鐘形曲線或正態分布。換言之,在整個訓練集中,中間層得到的值應該圍繞著中間值聚集,然后按照有規律的速率向四周逐漸減少。研究人員利用二氧化錳及相關化合物配方的兩節點中間層訓練變分自動編碼器后,構建了二維地圖描述兩個中間節點為訓練集的每個范例所取值。
明顯的是,使用相同前體化學品的訓練范例都集中在地圖的相同區域,各區域之間有清晰的界限。對于生成了二氧化錳四種常見的“多晶型”或晶體結構的訓練范例,也得到了相同的結果。將兩個地圖結合起來,顯示出具體前體與具體晶體結構之間的關系。“區域是連續的,我們認為這很棒。”研究人員說,“因為沒有原因表明這應該是這樣。”
變分自動編碼也是讓研究人員的系統能產生新配方的原因。因為中間層所采用的值堅持了一種概率分布,隨機從這種分布中取一個值都可能得到一種可行的配方。“這實際上涉及到機器學習領域目前熱門的多種話題。”研究人員表示,“以結構化的事物進行學習,讓專家進行解釋并交流,產生結構化的復雜數據——我們把上述都結合了起來。”
“‘可合成性’是材料科學中重要概念,但缺乏好的基于物理的描述。”將大數據和人工智能技術用于材料科學研究的美國公司Citrine Informatics創始人暨首席科學家指出,“因此,預期材料合成方面的難以理解多年來一直阻礙了新材料的計算平臺發展。研究人員在這項研究中采用了數據驅動的新穎方法來描繪材料合成,為使我們在計算方面確定有令人激動的特性且能在實驗室中實際合成的材料作出了重要貢獻。”
-
神經網絡
+關注
關注
42文章
4812瀏覽量
103125 -
AI
+關注
關注
88文章
34666瀏覽量
276584 -
人工智能
+關注
關注
1805文章
48871瀏覽量
247669
原文標題:AI系統能幫助合成新材料
文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
PanDao應用:輸入工件材料
人工合成石墨片與天然石墨片的差別
PanDao:確定工件材料成本
AWG電纜的常見材料類型
超導材料的制造工藝 超導材料的分類與比較
雙束FIB-SEM系統在材料科學中的應用

評論