德國研究者提出最新幾何深度學習擴展庫 PyTorch Geometric (PyG),具有快速、易用的優勢,使得實現圖神經網絡變得非常容易。作者開源了他們的方法,并提供教程和實例。
過去十年來,深度學習方法(例如卷積神經網絡和遞歸神經網絡)在許多領域取得了前所未有的成就,例如計算機視覺和語音識別。
研究者主要將深度學習方法應用于歐氏結構數據(Euclidean domains),但在許多重要的應用領域,如生物學、物理學、網絡科學、推薦系統和計算機圖形學,可能不得不處理非歐式結構的數據,比如圖和流形。
直到最近,深度學習在這些特定領域的采用一直很滯后,主要是因為數據的非歐氏結構性質使得基本操作(例如卷積)的定義相當困難。在這個意義上,幾何深度學習將深度學習技術擴展到了圖/流形結構數據。
圖神經網絡(GNN)是近年發展起來的一個很有前景的深度學習方向,也是一種強大的圖、點云和流形表示學習方法。
然而,實現GNN具有挑戰性,因為需要在高度稀疏且不規則、不同大小的數據上實現高GPU吞吐量。
近日,德國多特蒙德工業大學的研究者兩位Matthias Fey和Jan E. Lenssen,提出了一個基于PyTorch的幾何深度學習擴展庫PyTorch Geometric (PyG),為GNN的研究和應用再添利器。
論文:
https://arxiv.org/pdf/1903.02428.pdf
Yann Lecun也熱情推薦了這個工作,稱贊它是一個快速、美觀的PyTorch庫,用于幾何深度學習(圖和其他不規則結構的神經網絡)。
作者聲稱,PyG甚至比幾個月前NYU、AWS聯合開發的圖神經網絡庫 DGL(Deep Graph Library)快了15倍!
作者在論文中寫道:“這是一個PyTorch的幾何深度學習擴展庫,它利用專用的CUDA 內核實現了高性能。它遵循一個簡單的消息傳遞API,將最近提出的大多數卷積和池化層捆綁到一個統一的框架中。所有實現的方法都支持CPU和GPU計算,并遵循一個不可變的數據流范式,該范式支持圖結構隨時間的動態變化。”
PyG已經在MIT許可下發布,可以在GitHub上獲取。里面有完整的文檔說明,并提供了作為起點的教程和示例。
地址:
https://github.com/rusty1s/pytorch_geometric
PyTorch Geometry:基于PyTorch的幾何深度學習擴展庫
PyTorch Geometry是一個基于PyTorch的幾何深度學習擴展庫,用于不規則結構輸入數據,例如圖(graphs)、點云(point clouds)和流形(manifolds)。
PyTorch Geometry包含了各種針對圖形和其他不規則結構的深度學習方法,也稱為幾何深度學習,來自于許多已發表的論文。
此外,它還包含一個易于使用的mini-batch加載器、多GPU支持、大量通用基準數據集和有用的轉換,既可以學習任意圖形,也可以學習3D網格或點云。
在PyG中,我們用一個節點特征矩陣和一個稀疏鄰接元組
代表一個圖
其中以坐標
格式編碼索引,
保持?D?維邊緣特征。
所有面向用戶的API,據加載例程、多GPU支持、數據增強或模型實例化都很大程度上受到PyTorch的啟發,以便使它們盡可能保持熟悉。
Neighborhood Aggregation:將卷積算子推廣到不規則域通常表示為一個鄰域聚合(neighborhood aggregation),或message passing scheme (Gilmer et al., 2017)。
其中,表示一個可微分的置換不變函數,例如?sum, mean or max,而
和
表示可微分函數,例如?MLP。
在實踐中,這可以通過收集和散布節點特性并利用broadcasting進行
圖1
幾乎所有最近提出的鄰域聚合函數可以利用這個接口,已經集成到PyG的方法包括(但不限于):
對于任意圖形學習,我們已經實現了:
GCN(Kipf & Welling, 2017)和它的簡化版本SGC(Wu et al., 2019)
spectral chebyshev和ARMAfilter convolutionss (Defferrard et al., 2016; Bianchi et al., 2019)
GraphSAGE(Hamilton et al., 2017)
attention-based operatorsGAT(Veli?kovi? et al., 2018)及AGNN (Thekumparampil et al., 2018),
Graph Isomorphism Network (GIN) from Xu et al. (2019)
Approximate Personalized Propagation of Neural Predictions (APPNP) operator (Klicpera et al., 2019)
對于學習具有多維邊緣特征的點云,流形和圖,我們提供了:
Schlichtkrull et al. (2018)的relationalGCNoperator
PointNet++(Qi et al., 2017)
PointCNN(Li et al., 2018)
kernel-based methodsMPNN(Gilmer et al., 2017),
MoNet(Monti et al., 2017)
SplineCNN(Fey et al., 2018)
以及邊緣卷積算子EdgeCNN(Wang et al., 2018b).
實驗評估
我們通過對同類評估場景進行綜合比較研究,評估了利用PyG所實現方法的正確性。所有使用過的數據集的描述和統計可以在論文附錄中找到。
對于所有的實驗,我們都盡可能地遵循各自原始論文的超參數設置,GitHub存儲庫中提供了復制所有實驗的代碼。
表2:圖分類的結果
表3:點云分類的結果
我們對多個數據模型對進行了多次實驗,并報告了在單個NVIDIA GTX 1080 Ti上獲得的整個訓練過程的運行情況(表4)。與Deep Graph Library (DGL)(Wang et al., 2018a)相比,PyG訓練模型的速度快了15倍。
表4:訓練runtime比較
安裝、教程&示例
PyTorch Geometric使實現圖卷積網絡變得非常容易(請參閱GitHub上的教程)。
例如,這就是實現一個邊緣卷積層(edge convolution layer)所需的全部代碼:
import torchfrom torch.nn import Sequential as Seq, Linear as Lin, ReLUfrom torch_geometric.nn import MessagePassingclass EdgeConv(MessagePassing): def __init__(self, F_in, F_out): super(EdgeConv, self).__init__() self.mlp = Seq(Lin(2 * F_in, F_out), ReLU(), Lin(F_out, F_out)) def forward(self, x, edge_index): # x has shape [N, F_in] # edge_index has shape [2, E] return self.propagate(aggr='max', edge_index=edge_index, x=x) # shape [N, F_out] def message(self, x_i, x_j): # x_i has shape [E, F_in] # x_j has shape [E, F_in] edge_features = torch.cat([x_i, x_j - x_i], dim=1) # shape [E, 2 * F_in] return self.mlp(edge_features) # shape [E, F_out]
此外,與其他深度圖神經網絡庫相比,PyTorch Geometric的速度更快:
表:在一塊NVIDIA GTX 1080Ti上的訓練runtime
安裝
確保至少安裝了PyTorch 1.0.0,并驗證cuda/bin和cuda/include分別位于$PATH和 $cpathrespecific,例如:
$ python -c "import torch; print(torch.__version__)">>> 1.0.0$ echo $PATH>>> /usr/local/cuda/bin:...$ echo $CPATH>>> /usr/local/cuda/include:...
然后運行:
$ pip install --upgrade torch-scatter$ pip install --upgrade torch-sparse$ pip install --upgrade torch-cluster$ pip install --upgrade torch-spline-conv (optional)$ pip install torch-geometric
運行示例
cd examplespython cora.py
paper:
https://arxiv.org/pdf/1903.02428.pdf
GitHub:
https://github.com/rusty1s/pytorch_geometric
-
神經網絡
+關注
關注
42文章
4804瀏覽量
102637 -
深度學習
+關注
關注
73文章
5554瀏覽量
122428 -
pytorch
+關注
關注
2文章
809瀏覽量
13742 -
GNN
+關注
關注
1文章
31瀏覽量
6494
原文標題:LeCun推薦:最新PyTorch圖神經網絡庫,速度快15倍(GitHub+論文)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論