除了數(shù)據(jù)并行之外,還有其他的主流并行技術,即張星并行和流水線并行訓練。
張星并行和流水線并行技術通常被描述為模型并行,在開源社區(qū)中,最著名的兩個系統(tǒng)是NVIDIA的Megatron- M和Microsoft的DeepSpeed。
Megatron- M使用一維張量并行,線算符的權重被分割,大型矩陣乘法被分解為在不同設備上執(zhí)行的較小矩陣藏法,這可以是模型大小在集群中擴展并提高計算效率。
微軟的DeepSpeed和NVIDIA的Megatron- M兼容,并通過Zero Redundancy Optimizer改善數(shù)據(jù)并行訓練,消除內(nèi)存冗余。
Colossal-AI不僅提供了完整的現(xiàn)有并行方法,還提供了更高級的辦法,例如2D、2.5D 和3D張星并行,以及序列并行。
與1D張量并行相比,這些并稱為是2.5D 和3D張星并行,不僅切分參數(shù),而且沿更多張量唯獨切分輸入和輸出,正方形或者立方體的每個子集,表示可以分配給不同處理器的部分數(shù)據(jù)和工作。
2D張量并行基于經(jīng)典SUMMA矩陣利法算法
-
人工智能
+關注
關注
1804文章
48734瀏覽量
246653 -
英偉達
+關注
關注
22文章
3922瀏覽量
93136 -
深度學習
+關注
關注
73文章
5555瀏覽量
122494 -
gtc
+關注
關注
0文章
73瀏覽量
4564
發(fā)布評論請先 登錄
FPGA中的流水線設計
基于流水線負載平衡模型的并行爬蟲研究
基于流水線技術的并行高效FIR濾波器設計

基于流水線的并行FIR濾波器設計

CPU流水線的定義
Verilog基本功之:流水線設計Pipeline Design
嵌入式_流水線

什么是流水線 Jenkins的流水線詳解
以Gpipe作為流水線并行的范例進行介紹

Google GPipe為代表的流水線并行范式

評論