TensorFlow實戰之深度學習框架的對比 - 全文

Google近日發布了TensorFlow 1.0候選版，這第一個穩定版將是深度學習框架發展中的里程碑的一步。自TensorFlow于2015年底正式開源，距今已有一年多，這期間TensorFlow不斷給人以驚喜。在這一年多時間，TensorFlow已從初入深度學習框架大戰的新星，成為了幾近壟斷的行業事實標準。本文節選自《TensorFlow實戰》第二章。

主流深度學習框架對比

深度學習研究的熱潮持續高漲，各種開源深度學習框架也層出不窮，其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、Theano、DeepLearning4、Lasagne、Neon，等等。然而TensorFlow卻殺出重圍，在關注度和用戶數上都占據絕對優勢，大有一統江湖之勢。表2-1所示為各個開源框架在GitHub上的數據統計（數據統計于2017年1月3日），可以看到TensorFlow在star數量、fork數量、contributor數量這三個數據上都完勝其他對手。

究其原因，主要是Google在業界的號召力確實強大，之前也有許多成功的開源項目，以及Google強大的人工智能研發水平，都讓大家對Google的深度學習框架充滿信心，以至于TensorFlow在2015年11月剛開源的第一個月就積累了10000+的star。其次，TensorFlow確實在很多方面擁有優異的表現，比如設計神經網絡結構的代碼的簡潔度，分布式深度學習算法的執行效率，還有部署的便利性，都是其得以勝出的亮點。如果一直關注著TensorFlow的開發進度，就會發現基本上每星期TensorFlow都會有1萬行以上的代碼更新，多則數萬行。產品本身優異的質量、快速的迭代更新、活躍的社區和積極的反饋，形成了良性循環，可以想見TensorFlow未來將繼續在各種深度學習框架中獨占鰲頭。

表2-1 各個開源框架在GitHub上的數據統計

觀察表1還可以發現，Google、Microsoft、Facebook等巨頭都參與了這場深度學習框架大戰，此外，還有畢業于伯克利大學的賈揚清主導開發的Caffe，蒙特利爾大學Lisa?Lab團隊開發的Theano，以及其他個人或商業組織貢獻的框架。另外，可以看到各大主流框架基本都支持Python，目前Python在科學計算和數據挖掘領域可以說是獨領風騷。雖然有來自R、Julia等語言的競爭壓力，但是Python的各種庫實在是太完善了，Web開發、數據可視化、數據預處理、數據庫連接、爬蟲等無所不能，有一個完美的生態環境。僅在數據挖據工具鏈上，Python就有NumPy、SciPy、Pandas、Scikit-learn、XGBoost等組件，做數據采集和預處理都非常方便，并且之后的模型訓練階段可以和TensorFlow等基于Python的深度學習框架完美銜接。

表2-1和圖2-1所示為對主流的深度學習框架TensorFlow、Caffe、CNTK、Theano、Torch在各個維度的評分，本書2.2節會對各個深度學習框架進行比較詳細的介紹。

表2-2 主流深度學習框架在各個維度的評分

圖2-1??主流深度學習框架對比圖

各深度學習框架簡介

在本節，我們先來看看目前各流行框架的異同，以及各自的特點和優勢。

TensorFlow
TensorFlow是相對高階的機器學習庫，用戶可以方便地用它設計神經網絡結構，而不必為了追求高效率的實現親自寫C++或CUDA代碼。它和Theano一樣都支持自動求導，用戶不需要再通過反向傳播求解梯度。其核心代碼和Caffe一樣是用C++編寫的，使用C++簡化了線上部署的復雜度，并讓手機這種內存和CPU資源都緊張的設備可以運行復雜模型（Python則會比較消耗資源，并且執行效率不高）。除了核心代碼的C++接口，TensorFlow還有官方的Python、Go和Java接口，是通過SWIG（Simplified?Wrapper?and?Interface?Generator）實現的，這樣用戶就可以在一個硬件配置較好的機器中用Python進行實驗，并在資源比較緊張的嵌入式環境或需要低延遲的環境中用C++部署模型。SWIG支持給C/C++代碼提供各種語言的接口，因此其他腳本語言的接口未來也可以通過SWIG方便地添加。不過使用Python時有一個影響效率的問題是，每一個mini-batch要從Python中feed到網絡中，這個過程在mini-batch的數據量很小或者運算時間很短時，可能會帶來影響比較大的延遲。現在TensorFlow還有非官方的Julia、Node.js、R的接口支持。

TensorFlow也有內置的TF.Learn和TF.Slim等上層組件可以幫助快速地設計新網絡，并且兼容Scikit-learn?estimator接口，可以方便地實現evaluate、grid?search、cross?validation等功能。同時TensorFlow不只局限于神經網絡，其數據流式圖支持非常自由的算法表達，當然也可以輕松實現深度學習以外的機器學習算法。事實上，只要可以將計算表示成計算圖的形式，就可以使用TensorFlow。用戶可以寫內層循環代碼控制計算圖分支的計算，TensorFlow會自動將相關的分支轉為子圖并執行迭代運算。TensorFlow也可以將計算圖中的各個節點分配到不同的設備執行，充分利用硬件資源。定義新的節點只需要寫一個Python函數，如果沒有對應的底層運算核，那么可能需要寫C++或者CUDA代碼實現運算操作。

在數據并行模式上，TensorFlow和Parameter?Server很像，但TensorFlow有獨立的Variable?node，不像其他框架有一個全局統一的參數服務器，因此參數同步更自由。TensorFlow和Spark的核心都是一個數據計算的流式圖，Spark面向的是大規模的數據，支持SQL等操作，而TensorFlow主要面向內存足以裝載模型參數的環境，這樣可以最大化計算效率。

TensorFlow的另外一個重要特點是它靈活的移植性，可以將同一份代碼幾乎不經過修改就輕松地部署到有任意數量CPU或GPU的PC、服務器或者移動設備上。相比于Theano，TensorFlow還有一個優勢就是它極快的編譯速度，在定義新網絡結構時，Theano通常需要長時間的編譯，因此嘗試新模型需要比較大的代價，而TensorFlow完全沒有這個問題。TensorFlow還有功能強大的可視化組件TensorBoard，能可視化網絡結構和訓練過程，對于觀察復雜的網絡結構和監控長時間、大規模的訓練很有幫助。TensorFlow針對生產環境高度優化，它產品級的高質量代碼和設計都可以保證在生產環境中穩定運行，同時一旦TensorFlow廣泛地被工業界使用，將產生良性循環，成為深度學習領域的事實標準。

除了支持常見的網絡結構[卷積神經網絡（Convolutional?Neural?Network，CNN）、循環神經網絡（Recurent?Neural?Network，RNN）]外，TensorFlow還支持深度強化學習乃至其他計算密集的科學計算（如偏微分方程求解等）。TensorFlow此前不支持symbolic?loop，需要使用Python循環而無法進行圖編譯優化，但最近新加入的XLA已經開始支持JIT和AOT，另外它使用bucketing?trick也可以比較高效地實現循環神經網絡。TensorFlow的一個薄弱地方可能在于計算圖必須構建為靜態圖，這讓很多計算變得難以實現，尤其是序列預測中經常使用的beam?search。

TensorFlow的用戶能夠將訓練好的模型方便地部署到多種硬件、操作系統平臺上，支持Intel和AMD的CPU，通過CUDA支持NVIDIA的GPU（最近也開始通過OpenCL支持AMD的GPU，但沒有CUDA成熟），支持Linux和Mac，最近在0.12版本中也開始嘗試支持Windows。在工業生產環境中，硬件設備有些是最新款的，有些是用了幾年的老機型，來源可能比較復雜，TensorFlow的異構性讓它能夠全面地支持各種硬件和操作系統。同時，其在CPU上的矩陣運算庫使用了Eigen而不是BLAS庫，能夠基于ARM架構編譯和優化，因此在移動設備（Android和iOS）上表現得很好。

TensorFlow在最開始發布時只支持單機，而且只支持CUDA?6.5和cuDNN?v2，并且沒有官方和其他深度學習框架的對比結果。在2015年年底，許多其他框架做了各種性能對比評測，每次TensorFlow都會作為較差的對照組出現。那個時期的TensorFlow真的不快，性能上僅和普遍認為很慢的Theano比肩，在各個框架中可以算是墊底。但是憑借Google強大的開發實力，很快支持了新版的cuDNN（目前支持cuDNN?v5.1），在單GPU上的性能追上了其他框架。表2-3所示為https://github.com/soumith/convnet-benchmarks給出的各個框架在AlexNet上單GPU的性能評測。

表2-3??各深度學習框架在AlexNet上的性能對比

目前在單GPU的條件下，絕大多數深度學習框架都依賴于cuDNN，因此只要硬件計算能力或者內存分配差異不大，最終訓練速度不會相差太大。但是對于大規模深度學習來說，巨大的數據量使得單機很難在有限的時間完成訓練。這時需要分布式計算使GPU集群乃至TPU集群并行計算，共同訓練出一個模型，所以框架的分布式性能是至關重要的。TensorFlow在2016年4月開源了分布式版本，使用16塊GPU可達單GPU的15倍提速，在50塊GPU時可達到40倍提速，分布式的效率很高。目前原生支持的分布式深度學習框架不多，只有TensorFlow、CNTK、DeepLearning4J、MXNet等。不過目前TensorFlow的設計對不同設備間的通信優化得不是很好，其單機的reduction只能用CPU處理，分布式的通信使用基于socket的RPC，而不是速度更快的RDMA，所以其分布式性能可能還沒有達到最優。

Google?在2016年2月開源了TensorFlow?Serving，這個組件可以將TensorFlow訓練好的模型導出，并部署成可以對外提供預測服務的RESTful接口，如圖2-2所示。有了這個組件，TensorFlow就可以實現應用機器學習的全流程：從訓練模型、調試參數，到打包模型，最后部署服務，名副其實是一個從研究到生產整條流水線都齊備的框架。這里引用TensorFlow內部開發人員的描述：“TensorFlow?Serving是一個為生產環境而設計的高性能的機器學習服務系統。它可以同時運行多個大規模深度學習模型，支持模型生命周期管理、算法實驗，并可以高效地利用GPU資源，讓TensorFlow訓練好的模型更快捷方便地投入到實際生產環境”。除了TensorFlow以外的其他框架都缺少為生產環境部署的考慮，而Google作為廣泛在實際產品中應用深度學習的巨頭可能也意識到了這個機會，因此開發了這個部署服務的平臺。TensorFlow?Serving可以說是一副王牌，將會幫TensorFlow成為行業標準做出巨大貢獻。

圖2-2??TensorFlow?Serving架構

TensorBoard是TensorFlow的一組Web應用，用來監控TensorFlow運行過程，或可視化Computation?Graph。TensorBoard目前支持5種可視化：標量（scalars）、圖片（images）、音頻（audio）、直方圖（histograms）和計算圖（Computation?Graph）。TensorBoard的Events?Dashboard可以用來持續地監控運行時的關鍵指標，比如loss、學習速率（learning?rate）或是驗證集上的準確率（accuracy）；Image?Dashboard則可以展示訓練過程中用戶設定保存的圖片，比如某個訓練中間結果用Matplotlib等繪制（plot）出來的圖片；Graph?Explorer則可以完全展示一個TensorFlow的計算圖，并且支持縮放拖曳和查看節點屬性。TensorBoard的可視化效果如圖2-3和圖2-4所示。

圖2-3??TensorBoard的loss標量的可視化

圖2-4??TensorBoard的模型結構可視化

TensorFlow擁有產品級的高質量代碼，有Google強大的開發、維護能力的加持，整體架構設計也非常優秀。相比于同樣基于Python的老牌對手Theano，TensorFlow更成熟、更完善，同時Theano的很多主要開發者都去了Google開發TensorFlow（例如書籍Deep?Learning的作者Ian?Goodfellow，他后來去了OpenAI）。Google作為巨頭公司有比高?；蛘邆€人開發者多得多的資源投入到TensorFlow的研發，可以預見，TensorFlow未來的發展將會是飛速的，可能會把大學或者個人維護的深度學習框架遠遠甩在身后。

Caffe
官方網址：caffe.berkeleyvision.org/
GitHub：github.com/BVLC/caffe

Caffe全稱為Convolutional?Architecture?for?Fast?Feature?Embedding，是一個被廣泛使用的開源深度學習框架（在TensorFlow出現之前一直是深度學習領域GitHub?star最多的項目），目前由伯克利視覺學中心（Berkeley?Vision?and?Learning?Center，BVLC）進行維護。Caffe的創始人是加州大學伯克利的Ph.D.賈揚清，他同時也是TensorFlow的作者之一，曾工作于MSRA、NEC和Google?Brain，目前就職于Facebook?FAIR實驗室。Caffe的主要優勢包括如下幾點。

容易上手，網絡結構都是以配置文件形式定義，不需要用代碼設計網絡。
訓練速度快，能夠訓練state-of-the-art的模型與大規模的數據。
組件模塊化，可以方便地拓展到新的模型和學習任務上。

Caffe的核心概念是Layer，每一個神經網絡的模塊都是一個Layer。Layer接收輸入數據，同時經過內部計算產生輸出數據。設計網絡結構時，只需要把各個Layer拼接在一起構成完整的網絡（通過寫protobuf配置文件定義）。比如卷積的Layer，它的輸入就是圖片的全部像素點，內部進行的操作是各種像素值與Layer參數的convolution操作，最后輸出的是所有卷積核filter的結果。每一個Layer需要定義兩種運算，一種是正向（forward）的運算，即從輸入數據計算輸出結果，也就是模型的預測過程；另一種是反向（backward）的運算，從輸出端的gradient求解相對于輸入的gradient，即反向傳播算法，這部分也就是模型的訓練過程。實現新Layer時，需要將正向和反向兩種計算過程的函數都實現，這部分計算需要用戶自己寫C++或者CUDA（當需要運行在GPU時）代碼，對普通用戶來說還是非常難上手的。正如它的名字Convolutional?Architecture?for?Fast?Feature?Embedding所描述的，Caffe最開始設計時的目標只針對于圖像，沒有考慮文本、語音或者時間序列的數據，因此Caffe對卷積神經網絡的支持非常好，但對時間序列RNN、LSTM等支持得不是特別充分。同時，基于Layer的模式也對RNN不是非常友好，定義RNN結構時比較麻煩。在模型結構非常復雜時，可能需要寫非常冗長的配置文件才能設計好網絡，而且閱讀時也比較費力。

Caffe的一大優勢是擁有大量的訓練好的經典模型（AlexNet、VGG、Inception）乃至其他state-of-the-art（ResNet等）的模型，收藏在它的Model?Zoo（github.com/BVLC/?caffe/wiki/Model-Zoo）。因為知名度較高，Caffe被廣泛地應用于前沿的工業界和學術界，許多提供源碼的深度學習的論文都是使用Caffe來實現其模型的。在計算機視覺領域Caffe應用尤其多，可以用來做人臉識別、圖片分類、位置檢測、目標追蹤等。雖然Caffe主要是面向學術圈和研究者的，但它的程序運行非常穩定，代碼質量比較高，所以也很適合對穩定性要求嚴格的生產環境，可以算是第一個主流的工業級深度學習框架。因為Caffe的底層是基于C++的，因此可以在各種硬件環境編譯并具有良好的移植性，支持Linux、Mac和Windows系統，也可以編譯部署到移動設備系統如Android和iOS上。和其他主流深度學習庫類似，Caffe也提供了Python語言接口pycaffe，在接觸新任務，設計新網絡時可以使用其Python接口簡化操作。不過，通常用戶還是使用Protobuf配置文件定義神經網絡結構，再使用command?line進行訓練或者預測。Caffe的配置文件是一個JSON類型的.prototxt文件，其中使用許多順序連接的Layer來描述神經網絡結構。Caffe的二進制可執行程序會提取這些.prototxt文件并按其定義來訓練神經網絡。理論上，Caffe的用戶可以完全不寫代碼，只是定義網絡結構就可以完成模型訓練了。Caffe完成訓練之后，用戶可以把模型文件打包制作成簡單易用的接口，比如可以封裝成Python或MATLAB的API。不過在.prototxt文件內部設計網絡節構可能會比較受限，沒有像TensorFlow或者Keras那樣在Python中設計網絡結構方便、自由。更重要的是，Caffe的配置文件不能用編程的方式調整超參數，也沒有提供像Scikit-learn那樣好用的estimator可以方便地進行交叉驗證、超參數的Grid?Search等操作。Caffe在GPU上訓練的性能很好（使用單塊GTX?1080訓練AlexNet時一天可以訓練上百萬張圖片），但是目前僅支持單機多GPU的訓練，沒有原生支持分布式的訓練。慶幸的是，現在有很多第三方的支持，比如雅虎開源的CaffeOnSpark，可以借助Spark的分布式框架實現Caffe的大規模分布式訓練。

Theano

Theano誕生于2008年，由蒙特利爾大學Lisa?Lab團隊開發并維護，是一個高性能的符號計算及深度學習庫。因其出現時間早，可以算是這類庫的始祖之一，也一度被認為是深度學習研究和應用的重要標準之一。Theano的核心是一個數學表達式的編譯器，專門為處理大規模神經網絡訓練的計算而設計。它可以將用戶定義的各種計算編譯為高效的底層代碼，并鏈接各種可以加速的庫，比如BLAS、CUDA等。Theano允許用戶定義、優化和評估包含多維數組的數學表達式，它支持將計算裝載到GPU（Theano在GPU上性能不錯，但是CPU上較差）。與Scikit-learn一樣，Theano也很好地整合了NumPy，對GPU的透明讓Theano可以較為方便地進行神經網絡設計，而不必直接寫CUDA代碼。Theano的主要優勢如下。

集成NumPy，可以直接使用NumPy的ndarray，API接口學習成本低。
計算穩定性好，比如可以精準地計算輸出值很小的函數（像log(1+x)）。
動態地生成C或者CUDA代碼，用以編譯成高效的機器代碼。

因為Theano非常流行，有許多人為它編寫了高質量的文檔和教程，用戶可以方便地查找Theano的各種FAQ，比如如何保存模型、如何運行模型等。不過Theano更多地被當作一個研究工具，而不是當作產品來使用。雖然Theano支持Linux、Mac和Windows，但是沒有底層C++的接口，因此模型的部署非常不方便，依賴于各種Python庫，并且不支持各種移動設備，所以幾乎沒有在工業生產環境的應用。Theano在調試時輸出的錯誤信息非常難以看懂，因此DEBUG時非常痛苦。同時，Theano在生產環境使用訓練好的模型進行預測時性能比較差，因為預測通常使用服務器CPU（生產環境服務器一般沒有GPU，而且GPU預測單條樣本延遲高反而不如CPU），但是Theano在CPU上的執行性能比較差。

Theano在單GPU上執行效率不錯，性能和其他框架類似。但是運算時需要將用戶的Python代碼轉換成CUDA代碼，再編譯為二進制可執行文件，編譯復雜模型的時間非常久。此外，Theano在導入時也比較慢，而且一旦設定了選擇某塊GPU，就無法切換到其他設備。目前，Theano在CUDA和cuDNN上不支持多GPU，只在OpenCL和Theano自己的gpuarray庫上支持多GPU訓練，速度暫時還比不上CUDA的版本，并且Theano目前還沒有分布式的實現。不過，Theano在訓練簡單網絡（比如很淺的MLP）時性能可能比TensorFlow好，因為全部代碼都是運行時編譯，不需要像TensorFlow那樣每次feed?mini-batch數據時都得通過低效的Python循環來實現。

Theano是一個完全基于Python（C++/CUDA代碼也是打包為Python字符串）的符號計算庫。用戶定義的各種運算，Theano可以自動求導，省去了完全手工寫神經網絡反向傳播算法的麻煩，也不需要像Caffe一樣為Layer寫C++或CUDA代碼。Theano對卷積神經網絡的支持很好，同時它的符號計算API支持循環控制（內部名scan），讓RNN的實現非常簡單并且高性能，其全面的功能也讓Theano可以支持大部分state-of-the-art的網絡。Theano派生出了大量基于它的深度學習庫，包括一系列的上層封裝，其中有大名鼎鼎的Keras，Keras對神經網絡抽象得非常合適，以至于可以隨意切換執行計算的后端（目前同時支持Theano和TensorFlow）。Keras比較適合在探索階段快速地嘗試各種網絡結構，組件都是可插拔的模塊，只需要將一個個組件（比如卷積層、激活函數等）連接起來，但是設計新模塊或者新的Layer就不太方便了。除Keras外，還有學術界非常喜愛的Lasagne，同樣也是Theano的上層封裝，它對神經內網絡的每一層的定義都非常嚴謹。另外，還有scikit-neuralnetwork、nolearn這兩個基于Lasagne的上層封裝，它們將神經網絡抽象為兼容Scikit-learn接口的classifier和regressor，這樣就可以方便地使用Scikit-learn中經典的fit、transform、score等操作。除此之外，Theano的上層封裝庫還有blocks、deepy、pylearn2和Scikit-theano，可謂是一個龐大的家族。如果沒有Theano，可能根本不會出現這么多好用的Python深度學習庫。同樣，如果沒有Python科學計算的基石NumPy，就不會有SciPy、Scikit-learn和?Scikit-image，可以說Theano就是深度學習界的NumPy，是其他各類Python深度學習庫的基石。雖然Theano非常重要，但是直接使用Theano設計大型的神經網絡還是太煩瑣了，用?Theano實現Google?Inception就像用NumPy實現一個支持向量機（SVM）。且不說很多用戶做不到用Theano實現一個Inception網絡，即使能做到但是否有必要花這個時間呢？畢竟不是所有人都是基礎科學工作者，大部分使用場景還是在工業應用中。所以簡單易用是一個很重要的特性，這也就是其他上層封裝庫的價值所在：不需要總是從最基礎的tensor粒度開始設計網絡，而是從更上層的Layer粒度設計網絡。

Torch

Torch給自己的定位是LuaJIT上的一個高效的科學計算庫，支持大量的機器學習算法，同時以GPU上的計算優先。Torch的歷史非常悠久，但真正得到發揚光大是在Facebook開源了其深度學習的組件之后，此后包括Google、Twitter、NYU、IDIAP、Purdue等組織都大量使用Torch。Torch的目標是讓設計科學計算算法變得便捷，它包含了大量的機器學習、計算機視覺、信號處理、并行運算、圖像、視頻、音頻、網絡處理的庫，同時和Caffe類似，Torch擁有大量的訓練好的深度學習模型。它可以支持設計非常復雜的神經網絡的拓撲圖結構，再并行化到CPU和GPU上，在Torch上設計新的Layer是相對簡單的。它和TensorFlow一樣使用了底層C++加上層腳本語言調用的方式，只不過Torch使用的是Lua。Lua的性能是非常優秀的（該語言經常被用來開發游戲），常見的代碼可以通過透明的JIT優化達到C的性能的80%；在便利性上，Lua的語法也非常簡單易讀，擁有漂亮和統一的結構，易于掌握，比寫C/C++簡潔很多；同時，Lua擁有一個非常直接的調用C程序的接口，可以簡便地使用大量基于C的庫，因為底層核心是C寫的，因此也可以方便地移植到各種環境。Lua支持Linux、Mac，還支持各種嵌入式系統（iOS、Android、FPGA等），只不過運行時還是必須有LuaJIT的環境，所以工業生產環境的使用相對較少，沒有Caffe和TensorFlow那么多。

為什么不簡單地使用Python而是使用LuaJIT呢？官方給出了以下幾點理由。

LuaJIT的通用計算性能遠勝于Python，而且可以直接在LuaJIT中操作C的pointers。
Torch的框架，包含Lua是自洽的，而完全基于Python的程序對不同平臺、系統移植性較差，依賴的外部庫較多。
LuaJIT的FFI拓展接口非常易學，可以方便地鏈接其他庫到Torch中。Torch中還專門設計了N-Dimension?array?type的對象Tensor，Torch中的Tensor是一塊內存的視圖，同時一塊內存可能有許多視圖（Tensor）指向它，這樣的設計同時兼顧了性能（直接面向內存）和便利性。同時，Torch還提供了不少相關的庫，包括線性代數、卷積、傅里葉變換、繪圖和統計等，如圖2-5所示。

圖2-5??Torch提供的各種數據處理的庫

Torch的nn庫支持神經網絡、自編碼器、線性回歸、卷積網絡、循環神經網絡等，同時支持定制的損失函數及梯度計算。Torch因為使用了LuaJIT，因此用戶在Lua中做數據預處理等操作可以隨意使用循環等操作，而不必像在Python中那樣擔心性能問題，也不需要學習Python中各種加速運算的庫。不過，Lua相比Python還不是那么主流，對大多數用戶有學習成本。Torch在CPU上的計算會使用OpenMP、SSE進行優化，GPU上使用CUDA、cutorch、cunn、cuDNN進行優化，同時還有cuda-convnet的wrapper。Torch有很多第三方的擴展可以支持RNN，使得Torch基本支持所有主流的網絡。和Caffe類似的是，Torch也是主要基于Layer的連接來定義網絡的。Torch中新的Layer依然需要用戶自己實現，不過定義新Layer和定義網絡的方式很相似，非常簡便，不像Caffe那么麻煩，用戶需要使用C++或者CUDA定義新Layer。同時，Torch屬于命令式編程模式，不像Theano、TensorFlow屬于聲明性編程（計算圖是預定義的靜態的結構），所以用它實現某些復雜操作（比如beam?search）比Theano和TensorFlow方便很多。

Lasagne

Lasagne是一個基于Theano的輕量級的神經網絡庫。它支持前饋神經網絡，比如卷積網絡、循環神經網絡、LSTM等，以及它們的組合；支持許多優化方法，比如Nesterov?momentum、RMSprop、ADAM等；它是Theano的上層封裝，但又不像Keras那樣進行了重度的封裝，Keras隱藏了Theano中所有的方法和對象，而Lasagne則是借用了Theano中很多的類，算是介于基礎的Theano和高度抽象的Keras之間的一個輕度封裝，簡化了操作同時支持比較底層的操作。Lasagne設計的六個原則是簡潔、透明、模塊化、實用、聚焦和專注。

Keras

Keras是一個崇尚極簡、高度模塊化的神經網絡庫，使用Python實現，并可以同時運行在TensorFlow和Theano上。它旨在讓用戶進行最快速的原型實驗，讓想法變為結果的這個過程最短。Theano和TensorFlow的計算圖支持更通用的計算，而Keras則專精于深度學習。Theano和TensorFlow更像是深度學習領域的NumPy，而Keras則是這個領域的Scikit-learn。它提供了目前為止最方便的API，用戶只需要將高級的模塊拼在一起，就可以設計神經網絡，它大大降低了編程開銷（code?overhead）和閱讀別人代碼時的理解開銷（cognitive?overhead）。它同時支持卷積網絡和循環網絡，支持級聯的模型或任意的圖結構的模型（可以讓某些數據跳過某些Layer和后面的Layer對接，使得創建Inception等復雜網絡變得容易），從CPU上計算切換到GPU加速無須任何代碼的改動。因為底層使用Theano或TensorFlow，用Keras訓練模型相比于前兩者基本沒有什么性能損耗（還可以享受前兩者持續開發帶來的性能提升），只是簡化了編程的復雜度，節約了嘗試新網絡結構的時間?？梢哉f模型越復雜，使用Keras的收益就越大，尤其是在高度依賴權值共享、多模型組合、多任務學習等模型上，Keras表現得非常突出。Keras所有的模塊都是簡潔、易懂、完全可配置、可隨意插拔的，并且基本上沒有任何使用限制，神經網絡、損失函數、優化器、初始化方法、激活函數和正則化等模塊都是可以自由組合的。Keras也包括絕大部分state-of-the-art的Trick，包括Adam、RMSProp、Batch?Normalization、PReLU、ELU、LeakyReLU等。同時，新的模塊也很容易添加，這讓Keras非常適合最前沿的研究。Keras中的模型也都是在Python中定義的，不像Caffe、CNTK等需要額外的文件來定義模型，這樣就可以通過編程的方式調試模型結構和各種超參數。在Keras中，只需要幾行代碼就能實現一個MLP，或者十幾行代碼實現一個AlexNet，這在其他深度學習框架中基本是不可能完成的任務。Keras最大的問題可能是目前無法直接使用多GPU，所以對大規模的數據處理速度沒有其他支持多GPU和分布式的框架快。Keras的編程模型設計和Torch很像，但是相比Torch，Keras構建在Python上，有一套完整的科學計算工具鏈，而Torch的編程語言Lua并沒有這樣一條科學計算工具鏈。無論從社區人數，還是活躍度來看，Keras目前的增長速度都已經遠遠超過了Torch。

MXNet

MXNet是DMLC（Distributed?Machine?Learning?Community）開發的一款開源的、輕量級、可移植的、靈活的深度學習庫，它讓用戶可以混合使用符號編程模式和指令式編程模式來最大化效率和靈活性，目前已經是AWS官方推薦的深度學習框架。MXNet的很多作者都是中國人，其最大的貢獻組織為百度，同時很多作者來自cxxnet、minerva和purine2等深度學習項目，可謂博采眾家之長。它是各個框架中率先支持多GPU和分布式的，同時其分布式性能也非常高。MXNet的核心是一個動態的依賴調度器，支持自動將計算任務并行化到多個GPU或分布式集群（支持AWS、Azure、Yarn等）。它上層的計算圖優化算法可以讓符號計算執行得非常快，而且節約內存，開啟mirror模式會更加省內存，甚至可以在某些小內存GPU上訓練其他框架因顯存不夠而訓練不了的深度學習模型，也可以在移動設備（Android、iOS）上運行基于深度學習的圖像識別等任務。此外，MXNet的一個很大的優點是支持非常多的語言封裝，比如C++、Python、R、Julia、Scala、Go、MATLAB和JavaScript等，可謂非常全面，基本主流的腳本語言全部都支持了。在MXNet中構建一個網絡需要的時間可能比Keras、Torch這類高度封裝的框架要長，但是比直接用Theano等要快。MXNet的各級系統架構（下面為硬件及操作系統底層，逐層向上為越來越抽象的接口）如圖2-6所示。

圖2-6??MXNet系統架構

DIGITS

DIGITS（Deep?Learning?GPU?Training?System）不是一個標準的深度學習庫，它可以算是一個Caffe的高級封裝（或者Caffe的Web版培訓系統）。因為封裝得非常重，以至于你不需要（也不能）在DIGITS中寫代碼，即可實現一個深度學習的圖片識別模型。在Caffe中，定義模型結構、預處理數據、進行訓練并監控訓練過程是相對比較煩瑣的，DIGITS把所有這些操作都簡化為在瀏覽器中執行。它可以算作Caffe在圖片分類上的一個漂亮的用戶可視化界面（GUI），計算機視覺的研究者或者工程師可以非常方便地設計深度學習模型、測試準確率，以及調試各種超參數。同時使用它也可以生成數據和訓練結果的可視化統計報表，甚至是網絡的可視化結構圖。訓練好的Caffe模型可以被DIGITS直接使用，上傳圖片到服務器或者輸入url即可對圖片進行分類。

CNTK

CNTK（Computational?Network?Toolkit）是微軟研究院（MSR）開源的深度學習框架。它最早由start?the?deep?learning?craze的演講人創建，目前已經發展成一個通用的、跨平臺的深度學習系統，在語音識別領域的使用尤其廣泛。CNTK通過一個有向圖將神經網絡描述為一系列的運算操作，這個有向圖中子節點代表輸入或網絡參數，其他節點代表各種矩陣運算。CNTK支持各種前饋網絡，包括MLP、CNN、RNN、LSTM、Sequence-to-Sequence模型等，也支持自動求解梯度。CNTK有豐富的細粒度的神經網絡組件，使得用戶不需要寫底層的C++或CUDA，就能通過組合這些組件設計新的復雜的Layer。CNTK擁有產品級的代碼質量，支持多機、多GPU的分布式訓練。

CNTK設計是性能導向的，在CPU、單GPU、多GPU，以及GPU集群上都有非常優異的表現。同時微軟最近推出的1-bit?compression技術大大降低了通信代價，讓大規模并行訓練擁有了很高的效率。CNTK同時宣稱擁有很高的靈活度，它和Caffe一樣通過配置文件定義網絡結構，再通過命令行程序執行訓練，支持構建任意的計算圖，支持AdaGrad、RmsProp等優化方法。它的另一個重要特性就是拓展性，CNTK除了內置的大量運算核，還允許用戶定義他們自己的計算節點，支持高度的定制化。CNTK在2016年9月發布了對強化學習的支持，同時，除了通過寫配置文件的方式定義網絡結構，CNTK還將支持其他語言的綁定，包括Python、C++和C#，這樣用戶就可以用編程的方式設計網絡結構。CNTK與Caffe一樣也基于C++并且跨平臺，大部分情況下，它的部署非常簡單。PC上支持Linux、Mac和Windows，但是它目前不支持ARM架構，限制了其在移動設備上的發揮。圖2-7所示為CNTK目前的總體架構圖。

圖2-7??CNTK的總體架構圖

CNTK原生支持多GPU和分布式，從官網公布的對比評測來看，性能非常不錯。在多GPU方面，CNTK相對于其他的深度學習庫表現得更突出，它實現了1-bit?SGD和自適應的mini-batching。圖2-8所示為CNTK官網公布的在2015年12月的各個框架的性能對比。在當時，CNTK是唯一支持單機8塊GPU的框架，并且在分布式系統中可以超越8塊GPU的性能。

圖2-8??CNTK與各個框架的性能對比

Deeplearning4J

Deeplearning4J（簡稱DL4J）是一個基于Java和Scala的開源的分布式深度學習庫，由Skymind于2014年6月發布，其核心目標是創建一個即插即用的解決方案原型。埃森哲、雪弗蘭、博斯咨詢和IBM等都是DL4J的客戶。DL4J擁有一個多用途的n-dimensional?array的類，可以方便地對數據進行各種操作；擁有多種后端計算核心，用以支持CPU及GPU加速，在圖像識別等訓練任務上的性能與Caffe相當；可以與Hadoop及Spark自動整合，同時可以方便地在現有集群（包括但不限于AWS，Azure等）上進行擴展，同時DL4J的并行化是根據集群的節點和連接自動優化，不像其他深度學習庫那樣可能需要用戶手動調整。DL4J選擇Java作為其主要語言的原因是，目前基于Java的分布式計算、云計算、大數據的生態非常龐大。用戶可能擁有大量的基于Hadoop和Spark的集群，因此在這類集群上搭建深度學習平臺的需求便很容易被DL4J滿足。同時JVM的生態圈內還有數不勝數的Library的支持，而DL4J也創建了ND4J，可以說是JVM中的NumPy，支持大規模的矩陣運算。此外，DL4J還有商業版的支持，付費用戶在出現問題時可以通過電話咨詢尋求支持。

Chainer

Chainer是由日本公司Preferred?Networks于2015年6月發布的深度學習框架。Chainer對自己的特性描述如下。

Powerful：支持CUDA計算，只需要幾行代碼就可以使用GPU加速，同時只需少許改動就可以運行在多GPU上。
Flexible：支持多種前饋神經網絡，包括卷積網絡、循環網絡、遞歸網絡，支持運行中動態定義的網絡（Define-by-Run）。
Intuitive：前饋計算可以引入Python的各種控制流，同時反向傳播時不受干擾，簡化了調試錯誤的難度。
絕大多數的深度學習框架是基于“Define-and-Run”的，也就是說，需要首先定義一個網絡，再向網絡中feed數據（mini-batch）。因為網絡是預先靜態定義的，所有的控制邏輯都需要以data的形式插入網絡中，包括像Caffe那樣定義好網絡結構文件，或者像Theano、Torch、TensorFlow等使用編程語言定義網絡。而Chainer則相反，網絡是在實際運行中定義的，Chainer存儲歷史運行的計算結果，而不是網絡的結構邏輯，這樣就可以方便地使用Python中的控制流，所以無須其他工作就可以直接在網絡中使用條件控制和循環。

Leaf

Leaf是一個基于Rust語言的直觀的跨平臺的深度學習乃至機器智能框架，它擁有一個清晰的架構，除了同屬Autumn?AI的底層計算庫Collenchyma，Leaf沒有其他依賴庫。它易于維護和使用，并且擁有非常高的性能。Leaf自身宣傳的特點是為Hackers定制的，這里的Hackers是指希望用最短的時間和最少的精力實現機器學習算法的技術極客。它的可移植性非常好，可以運行在CPU、GPU和FPGA等設備上，可以支持有任何操作系統的PC、服務器，甚至是沒有操作系統的嵌入式設備，并且同時支持OpenCL和CUDA。Leaf是Autumn?AI計劃的一個重要組件，后者的目標是讓人工智能算法的效率提高100倍。憑借其優秀的設計，Leaf可以用來創建各種獨立的模塊，比如深度強化學習、可視化監控、網絡部署、自動化預處理和大規模產品部署等。

Leaf擁有最簡單的API，希望可以最簡化用戶需要掌握的技術棧。雖然才剛誕生不久，Leaf就已經躋身最快的深度學習框架之一了。圖2-9所示為Leaf官網公布的各個框架在單GPU上訓練VGG網絡的計算時間（越小越好）的對比（這是和早期的TensorFlow對比，最新版的TensorFlow性能已經非常好了）。

圖2-9??Leaf和各深度學習框架的性能對比（深色為forawrd，淺色為backward）

DSSTNE

DSSTNE（Deep?Scalable?Sparse?Tensor?Network?Engine）是亞馬遜開源的稀疏神經網絡框架，在訓練非常稀疏的數據時具有很大的優勢。DSSTNE目前只支持全連接的神經網絡，不支持卷積網絡等。和Caffe類似，它也是通過寫一個JSON類型的文件定義模型結構，但是支持非常大的Layer（輸入和輸出節點都非常多）；在激活函數、初始化方式及優化器方面基本都支持了state-of-the-art的方法，比較全面；支持大規模分布式的GPU訓練，不像其他框架一樣主要依賴數據并行，DSSTNE支持自動的模型并行（使用數據并行需要在訓練速度和模型準確度上做一定的trade-off，模型并行沒有這個問題）。

在處理特征非常多（上億維）的稀疏訓練數據時（經常在推薦、廣告、自然語言處理任務中出現），即使一個簡單的3個隱層的MLP（Multi-Layer?Perceptron）也會變成一個有非常多參數的模型（可能高達上萬億）。以傳統的稠密矩陣的方式訓練方法很難處理這么多的模型參數，更不必提超大規模的數據量，而DSSTNE有整套的針對稀疏數據的優化，率先實現了對超大稀疏數據訓練的支持，同時在性能上做了非常大的改進。

在DSSTNE官方公布的測試中，DSSTNE在MovieLens的稀疏數據上，在單M40?GPU上取得了比TensorFlow快14.8倍的性能提升（注意是和老版的TensorFlow比較），如圖2-10所示。一方面是因為DSSTNE對稀疏數據的優化；另一方面是TensorFlow在數據傳輸到GPU上時花費了大量時間，而DSSTNE則優化了數據在GPU內的保留；同時DSSTNE還擁有自動模型并行功能，而TensorFlow中則需要手動優化，沒有自動支持。

圖2-10??DSSTNE在稀疏數據上與TensorFlow的性能對比

作者：黃文堅，PPmoney大數據算法總監；唐源，美國Uptake數據科學家。
《TensorFlow實戰》是國內首本由Google TensorFlow團隊官方推薦的教程，兩位作者也均是TensorFlow開發者，其中唐源是TensorFlow開發團隊的committer。本書結合了大量實例代碼，深入淺出地介紹了如何使用TensorFlow創建各種深度學習模型，是初學者入門的最佳書籍。

閱讀全文

上一頁 1 2 3 4 5 6 7 8 9全文

本文導航

第 1 頁：TensorFlow實戰之深度學習框架的對比
第 2 頁：深度學習框架
第 3 頁：TensorFlow?Serving架構
第 4 頁：Layer
第 5 頁：Theano
第 6 頁：LuaJIT
第 7 頁：MXNet
第 8 頁：CNTK設計
第 9 頁：leaf

深度學習(119797) 深度學習(119797)
tensorflow(60231) tensorflow(60231)

國產深度學習框架的挑戰和機會

電子發燒友網報道（文/李彎彎）深度學習框架是一種底層開發工具，是集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件、豐富的工具組件于一體的平臺。 ? 有了深度學習框架，工程師在工作時調

2022-06-07 00:01:00

3415

11種深度學習框架影響力對比

現在數據科學領域最熱門的方向仍舊是深度學習。相應地，深度學習框架也處于飛速變革之中?，F在最流行的框架，除Theano外，5年前都不存在。

2018-10-15 11:50:17

8557

如何使用tensorflow快速搭建起一個深度學習項目

我們繼續以 NG 課題組提供的 sign 手勢數據集為例，學習如何通過Tensorflow快速搭建起一個深度學習項目。數據集標簽共有零到五總共 6 類標簽，示例如下

2018-10-25 08:57:49

7499

TensorFlow、PyTorch，“后浪”OneFlow 有沒有機會

TensorFlow、PyTorch，“后浪”OneFlow 有沒有機會 | 一流科技工程師成誠編者按：7月31日，一流科技在創業1300天后，他們宣布開源自研的深度學習框架OneFlow，此前，CSDN對CEO袁進輝進行了專訪。本文中，一流科技工程師成...

2021-07-27 08:24:50

TensorFlow是什么

大約 845 個貢獻者共提交超過 17000 次，這本身就是衡量 TensorFlow 流行度和性能的一個指標。圖 1 列出了當前流行的深度學習框架，從中能夠清楚地看到 TensorFlow

2020-07-22 10:14:37

TensorFlow的特點和基本的操作方式

Tensorflow是Google開源的深度學習框架，來自于Google Brain研究項目，在Google第一代分布式機器學習框架DistBelief的基礎上發展起來。Tensorflow于

2020-11-23 09:56:04

Tensorflow實戰經驗總結

Tensorflow 實戰筆記

2019-06-10 15:10:05

實戰視覺圖像處理：LabVIEW二值化結果顯示與對比

LabVIEW之Yolov3+tensorflow深度學習教程》點擊了解課程詳情：http://url.elecfans.com/u/8d673fae39人工智能AI到來，工業上很多學員不了解C#中

2020-12-09 14:53:37

深度學習框架TensorFlow&TensorFlow-GPU詳解

TensorFlow&TensorFlow-GPU：深度學習框架TensorFlow&TensorFlow-GPU的簡介、安裝、使用方法詳細攻略

2018-12-25 17:21:10

深度學習框架只為GPU?

CPU優化深度學習框架和函數庫機器學***器

2021-02-22 06:01:02

深度學習DeepLearning實戰

一：深度學習DeepLearning實戰時間地點：1 月 15日— 1 月18 日二：深度強化學習核心技術實戰時間地點： 1 月 27 日— 1 月30 日(第一天報到授課三天；提前環境部署電腦

2021-01-09 17:01:54

深度學習在醫學圖像分割與病變識別中的應用實戰

突破性的進展。代碼實例下面通過一個代碼實例，演示如何使用Python和深度學習庫TensorFlow進行醫學圖像分割與病變識別。這里以肺部CT圖像中的腫瘤分割為例 import numpy

2023-09-04 11:11:23

深度學習在汽車中的應用

設計支持深度學習功能的系統時必須考慮這些限制因素。開發人員可以使用前端工具，如Caffe（最初由加州大學伯克利分校開發的深度學習框架）或TensorFlow（谷歌的發明）來開發總網絡、層和相應的功能，以及

2019-03-13 06:45:03

深度強化學習實戰

2021-01-10 13:42:26

Anaconda之tensorflow：深度學習之Anaconda下安裝tensorflow正確運行之史上最強攻略

Anaconda之tensorflow：深度學習之Anaconda下安裝tensorflow正確運行之史上最強攻略

2018-12-21 10:40:30

LabVIEW自帶深度學習，凍結Tensorflow完成深度學習。資料下載

本帖最后由 wcl86 于 2021-5-14 15:26 編輯概述這個例子演示了在Vision開發模塊中使用Model Importer API來使用深度學習為缺陷檢查應用程序執行對象檢測

2020-07-29 17:41:31

Labview深度學習tensorflow人工智能目標檢測-教學貼【連載】

本帖最后由 wcl86 于 2021-6-3 16:23 編輯應廣大學員要求，現開通Labview深度學習tensorflow人工智能目標檢測-教學貼，有需要的學員，可以收藏本貼，接下來會

2021-05-28 11:58:52

Mali GPU支持tensorflow或者caffe等深度學習模型嗎

Mali GPU 支持tensorflow或者caffe等深度學習模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓練

2022-09-16 14:13:01

Nanopi深度學習之路(1)深度學習框架分析

最耳熟能詳的就是TensorFlow，但再稍有了解的，會知道TensorFlow太過于底層，實現深度學習的過程復雜，但其框架是相當好的，Keras相比TensorFlow，具有簡單易用的特點，更適合深度學習

2018-06-04 22:32:12

Nanopi深度學習之路(2)深度學習框架安裝前的系統配置

`Nanopi深度學習之路這一系列的日記內容如下：1. 根據深度學習任務配置Nanopi2。2. 在Nanopi2上安裝Keras和TensorFlow。3. 在Nanopi2上部署一個訓練好的深度

2018-06-05 17:29:51

Nanopi深度學習之路(4)深度學習框架安裝前的依賴項安裝

“Using TensorFlow backend”說明使用的是TensorFlow后端，使用keras必須安裝TensorFlow，Theano，或者 CNTK之一，后端的意思是使用某一底層深度學習框架

2018-06-08 19:54:11

PTB數據集建立語言模型

《實戰Google深度學習框架》之RNN學習筆記2 LSTM對PTB數據集的建模

2019-09-26 16:21:19

Py之TFCudaCudnn：Win10下安裝深度學習框架Tensorflow+Cuda+Cudnn最簡單最快捷最詳細攻略

Py之TFCudaCudnn：Win10下安裝深度學習框架Tensorflow+Cuda+Cudnn最簡單最快捷最詳細攻略

2018-12-20 10:35:16

TDA4對深度學習的重要性

，TIDL TIOVX Node 調用TIDL 的深度學習加速庫進行感知，并將結果進行輸出。圖4. TIDL Runtime如圖5所示，是TIDL的軟件框架。在TIDL上，深度學習網絡應用開發主要分為

2022-11-03 06:53:11

iTOP-RK3588開發板使用 tensorflow框架

TensorFlow 是一個軟件庫或框架，由 Google 團隊設計，以最簡單的方式實現機器學習和深度學習概念。它結合了優化技術的計算代數，便于計算許多數學表達式。TensorFlow 有以下重要

2023-10-08 10:04:31

labview+yolov4+tensorflow+openvion深度學習

。1、讓沒有任何python，tensorflow基礎的學員學習到如何搭建深度學習訓練平臺。2、學會使用imglabel軟件標注圖片，弄清楚怎么樣標注目標3、學會利用labview調用

2021-05-10 22:33:46

labview測試tensorflow深度學習SSD模型識別物體

安裝labview2019 vision，自帶深度學習推理工具，支持tensorflow模型。配置好python下tensorflow環境配置好object_detection API下載SSD模型

2020-08-16 17:21:38

labview調用深度學習tensorflow模型非常簡單，附上源碼和模型

本帖最后由 wcl86 于 2021-9-9 10:39 編輯 `labview調用深度學習tensorflow模型非常簡單，效果如下，附上源碼和訓練過的模型：[hide][/hide

2021-06-03 16:38:25

matplotlib動態演示深度學習之tensorflow將神經網絡系統自動學習散點(二次函數+noise)并優化修正并且將輸出結果可視化

TF之NN：matplotlib動態演示深度學習之tensorflow將神經網絡系統自動學習散點(二次函數+noise)并優化修正并且將輸出結果可視化

2018-12-21 10:48:26

spark和深度學習的基本原理

當Spark遇上TensorFlow分布式深度學習框架原理和實踐

2019-09-09 08:46:51

【NanoPi K1 Plus試用體驗】搭建深度學習框架

近幾年各種深度學習框架涌現，大家可能很難從眾多的深度學習框架中選擇一個合適的框架進行學習。對于深度學習的初學者，或者覺得Tensorflow,Caffe等框架學習困難難以上手的人，可以考慮學習

2018-07-17 11:40:31

主流深度學習框架比較

DL：主流深度學習框架多個方向PK比較

2018-12-26 11:10:18

人工智能AI-卷積神經網絡LabVIEW之Yolov3+tensorflow深度學習有用嗎？

介紹：人工智能AI到來，工業上很多學員不了解C#中labview中如何調用tensorflow進行深度學習模型的訓練和調用，推出一整套完整的簡易學的視頻課程，使學員能在沒有任何深度學習理論基礎，不懂

2020-11-27 11:19:37

全網唯一一套labview深度學習教程：tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程

`【新課上線】tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程（強推）課程目標：1、讓沒有任何python，tensorflow基礎的學員學習到如何搭建深度學習訓練平臺。2

2020-08-10 10:38:12

在RK3399開發板上如何去實現一種人工智能深度學習框架呢

在RK3399開發板上如何去實現一種人工智能深度學習框架呢？

2022-03-07 07:00:05

干貨！教你怎么搭建TensorFlow深度學習開發環境！

操作系統。2017年，TensorFlow終于推出了1.0版本，這標志著應用最廣泛、使用人數最多的深度學習算法TensorFlow推出了正式版。目前TensorFlow最新的版本

2018-09-27 13:56:06

淺談深度學習之TensorFlow

神經網絡和深度學習的概念，但為了完整起見，我們將在這里介紹基礎知識，并探討 TensorFlow 的哪些特性使其成為深度學習的熱門選擇。神經網絡是一個生物啟發式的計算和學習模型。像生物神經元一樣，它們從其他

2020-07-28 14:34:04

谷歌深度學習插件tensorflow

前段時間忙著研究Zedboard，這幾天穿插著加入Python的深度學習的研究，最近使用谷歌的tensorflow比較多，而且官方出了中文教程，比較給力，下面在Windows10下安裝一下

2018-07-04 13:46:51

迅為RK3399開發板人工智能深度學習框架

`迅為率先在RK3399 開發板上支持了Docker、TensorFlow目標檢測API、OpenCV、Keras、scikit-learn、pytorch和Python等，組成了人工智能深度學習

2021-05-21 17:28:46

基于GPU實現的深度學習的數據庫

應該是最便于集成使用的深度學習框架庫。 tensorflow和mxnet據說也有對應的android庫，因時間原因暫未。 CNNdroid，網址，這個是用 render 作優化的深度學習框架，不過就代碼實現和實際測試結果來看，性能一般。工程定位實現可實時、體積小、通用的深度學習預測框架。

2017-09-28 20:02:26

代碼分析CNTK和TensorFlow高層次的對比

深度神經網絡的計算網絡工具包，此項目已在Github上開源。因為我最近寫了關于TensorFlow的文章，所以想比較一下這兩個系統的相似和差異之處。畢竟，CNTK也是許多圖像識別挑戰賽的衛冕冠軍。為了內容的完整性，我應該也對比一下Theano、Torch和Caffe。后三者也是現在非常流行的框架。

2017-10-12 14:17:04

開源深度學習框架對比研究的三個主要維度學習

本節對5個開源深度學習框架進行對比研究，主要側重于3個維度研究：硬件支持率、速度和準確率、社區活躍性。他們分別是：TensorFlow、Caffe、Keras、Torch、DL4j 。 2.3.1

2017-11-15 12:04:00

3896

通過對比深度學習各大框架的優缺點尋找最優

開源的深度學習神經網絡正步入成熟，而現在有許多框架具備為個性化方案提供先進的機器學習和人工智能的能力。那么如何決定哪個開源框架最適合你呢？本文試圖通過對比深度學習各大框架的優缺點，從而為各位讀者提供

2017-11-15 19:04:08

22198

深度學習框架與前端接口介紹

深度學習正以迅雷不及掩耳之勢發展著，近幾年各種不同的深度學習框架也如雨后春筍般紛紛出現，在大廠的支持下這些框架在深度學習的舞臺上華麗登場各顯神通。

2018-01-05 15:12:58

8403

袁進輝：分享了深度學習框架方面的技術進展

1月17日，院友袁進輝博士回到微軟亞洲研究院做了題為《打造最強深度學習引擎》的報告，分享了深度學習框架方面的技術進展。

2018-01-25 09:23:45

4492

TensorFlow的框架結構解析

TensorFlow是谷歌的第二代開源的人工智能學習系統，是用來實現神經網絡的內置框架學習軟件庫。目前，TensorFlow機器學習已經成為了一個研究熱點。由基本的機器學習算法入手，簡析機器學習算法

2018-04-04 14:39:00

6874

深度學習入門課：你需要了解的十大框架和選型攻略

深度學習框架是幫助使用者進行深度學習的工具，它的出現降低了深度學習入門的門檻，你不需要從復雜的神經網絡開始編代碼，就可以根據需要使用現有的模型。做個比喻，一套深度學習框架就像是一套積木，各個組件就是某個模型或算法的一部分，使用者可以自己設計和組裝符合相關數據集需求的積木。

2018-02-13 03:43:00

2899

深度學習框架排名:TensorFlow第一，PyTorch第二

Karpathy表示，綜合過去6年發表在ArXiv的4300篇機器學習論文（數據來源：cs.[CV|CL|LG|AI|NE]/stat.ML），根據其中各框架被提及的次數

2018-04-02 16:46:41

11100

深度學習發展的5個主力框架

在這篇文章中，我想向大家介紹推動深度學習發展的5個主力框架。這些框架使數據科學家和工程師更容易為復雜問題構建深度學習解決方案，并執行更復雜的任務。這只是眾多開源框架中的一小部分，由不同的科技巨頭支持，并相互推動更快創新。

2018-05-04 10:30:00

3747

深度學習的發展與應用,TensorFlow從研究到實踐

TensorFlow 的目標是成為人人可用的機器學習平臺，能夠幫助機器學習的研究者、開發者，去表達自己的想法，去進行探索性研究，去建立自己的系統，去實現基于具體場景的AI應用和產品。有了通用的平臺

2018-06-05 11:00:23

4355

小米自研開源移動端深度學習框架MACE

MACE，是指小米公司自研的移動端深度學習框架Mobile AI Compute Engine。2017年12月，這一深度學習框架就在小米公司內部正式發布了。

2018-07-26 14:06:46

3502

小米AI移動端深度學習框架MACE開源了！

MACE，是指小米公司自研的移動端深度學習框架Mobile AI Compute Engine。2017年12月，這一深度學習框架就在小米公司內部正式發布了。

2018-07-26 14:06:46

4715

【連載】深度學習筆記7：Tensorflow入門

和調參等問題。這一切工作我們都是基于numpy 完成的，沒有調用任何深度學習框架。在學習深度學習的時候，一開始不讓大家直接上手框架可謂良苦用心，旨在讓大家能夠跟筆者一樣，一步一步通過 numpy 搭建神經網絡的過程就是要讓你能夠更加深入

2018-08-20 12:47:11

3084

【連載】深度學習筆記7：Tensorflow入門

的 Tensorflow，微軟的 CNTK，伯克利視覺中心開發的 caffe，以及別具一格的 PyTorch 和友好易用的 keras，本系列深度學習筆記打算從 Tensorflow 開始，對三大主流易用的深度學習框架

2018-08-24 18:31:54

2541

深度學習入門教程之TensorFlow入門、原理與進階實戰教程免費下載

本章節主要學習TensorFlow的基礎語法及功能函數。學完本章后，TensorFlow代碼對你來講將不再陌生，你可以很輕易看懂網上和書中例子的代碼，并可以嘗試寫一些簡單的模型或算法。

2018-08-28 18:44:50

258

你最看好哪個深度學習框架呢？

開源的深度學習神經網絡正步入成熟，而現在有許多框架具備為個性化方案提供先進的機器學習和人工智能的能力。

2018-09-21 17:02:53

6364

11種深度學習框架影響力評估

總體而言，PyTorch是第三流行的框架，也是第二流行的獨立框架。它比TensorFlow要年輕，流行度的增速十分迅猛。它也支持TensorFlow尚不支持的一些定制。PyTorch背后站著的是Facebook。

2018-09-30 08:48:38

2677

Apache Spark的分布式深度學習框架BigDL的概述

該視頻概述了Apache Spark *的BigDL分布式深度學習框架。

2018-10-30 06:41:00

2947

機器學習框架Tensorflow 2.0的這些新設計你了解多少

幾天前，Tensorflow剛度過自己的3歲生日，作為當前最受歡迎的機器學習框架，Tensorflow在這個寶座上已經盤踞了近三年。無論是成熟的Keras，還是風頭正盛的pytorch，它的地位似乎

2018-11-17 11:33:59

2979

7種架構范例的深度學習，每個范例都提供了TensorFlow教程

在下面的部分中，我將簡要描述這 7 種架構范例，并提供每個范例的演示性TensorFlow 教程的鏈接。請參閱最后的 “基礎拓展” 部分，該部分討論了深度學習的一些令人興奮的領域，不完全屬于這七個類別。

2019-02-13 10:40:58

3518

谷歌開源了一個強大的NLP深度學習框架Lingvo

Lingvo 是一個 Tensorflow 框架，為協作式深度學習研究提供了一個完整的解決方案，特別側重于 sequence-to-sequence 模型。Lingvo 模型由靈活且易于擴展的模塊化

2019-02-27 09:28:50

10988

分析并比較五種非常有用的深度學習框架的優點及應用。

我喜歡TensorFlow的原因有兩點：它完全是開源的，并且有出色的社區支持。TensorFlow為大多數復雜的深度學習模型預先編寫好了代碼，比如遞歸神經網絡和卷積神經網絡。

2019-04-24 17:26:35

4576

深度學習框架你了解多少

開源的深度學習神經網絡正步入成熟，而現在有許多框架具備為個性化方案提供先進的機器學習和人工智能的能力。

2019-07-08 10:31:30

2057

為什么學習深度學習需要使用PyTorch和TensorFlow框架

如果你需要深度學習模型，那么 PyTorch 和 TensorFlow 都是不錯的選擇。并非每個回歸或分類問題都需要通過深度學習來解決。甚至可以說，并非每個回歸或分類問題都需要通過機器學習來解決。畢竟，許多數據集可以用解析方法或簡單的統計過程進行建模。

2019-09-14 10:57:00

3181

TensorFlow深度學習PDF電子書免費下載

本書共分 5 方面內容：基礎知識、關鍵模塊、算法模型、內核揭秘、生態發展。前兩方面由淺入深地介紹了 TensorFlow 平臺，算法模型方面依托 TensorFlow 講解深度學習模型，內核揭秘

2019-12-12 08:00:00

一個全新的深度學習框架——計圖

清華大學計算機系胡事民教授研究團隊提出了一個全新的深度學習框架——計圖（Jittor）。Jittor是一個采用元算子表達神經網絡計算單元、完全基于動態編譯（Just-in-Time）的深度學習框架。

2020-03-26 15:50:29

6456

深度學習框架Tensorflow的安裝和基礎實戰教程免費下載

Tensorflow 的安裝分為 Windows 安裝和 Linux 安裝，實際應用中我們推薦使用 ubuntu 安裝 tf，windows 方面在安裝和使用中會遇到很多的坑，可能會產生一些不必要

2020-05-27 08:00:00

深度學習框架大PK

近年來，開發者社區中，「開源」成了新流行趨勢。尤其是深度學習框架，自騰訊2017年將ncnn開源之后，各大AI實驗室都「慷慨」的將自己的框架開源，以實現較為快速的創新。

2020-07-10 18:37:37

1116

飛槳框架高層API 十行代碼搞定深度學習

向往深度學習技術，可是深度學習框架太難學怎么辦？百度傾心打造飛槳框架高層 API，零基礎也能輕松上手深度學習，一起來看看吧？另：文末有福利，一定要看完呦~ 高層 API，What 深度學習

2020-12-02 17:52:52

2053

天才黑客George Hotz開源了一個小型深度學習框架tinygrad

TensorFlow、PyTorch 這樣龐大的深度學習框架。 ? 除了這類主流框架之外，開發者們也會開源一些小而精的框架或者庫。 ? ? ?

2020-12-16 09:36:56

3883

細數二十一世紀以來深度學習框架的發展歷程

回顧深度學習框架的演變，我們可以清楚地看到深度學習框架和深度學習算法之間的緊密耦合關系。這種相互依賴的良性循環推動了深度學習框架和工具的快速發展。

2021-01-08 14:29:59

4257

深度學習算法和應用涌現的背后，是各種各樣的深度學習工具和框架

2021-01-21 13:46:55

2477

使用TensorFlow建立深度學習和機器學習網絡

教你使用TensorFlow建立深度學習和機器學習網絡。

2021-03-26 09:44:02

國產框架超越 PyTorch 和 TensorFlow？

在深度學習領域，PyTorch、TensorFlow 等主流框架，毫無疑問占據絕大部分市場份額，就連百度這樣級別的公司，也是花費了大量人力物力，堪堪將 PaddlePaddle 推入主流。在這

2021-04-09 15:11:39

2113

如何使用框架訓練網絡加速深度學習推理

在這篇文章中，我們解釋了如何使用 TensorFlow-to-ONNX-to-TensorRT 工作流來部署深度學習應用程序，并給出了幾個示例。第一個例子是 ResNet-50 上的 ONNX-

2022-04-01 15:45:04

2473

八種主流深度學習框架的介紹

導讀：近幾年隨著深度學習算法的發展，出現了許多深度學習框架。這些框架各有所長，各具特色。常用的開源框架有TensorFlow、Keras、Caffe、PyTorch、Theano、CNTK

2022-04-26 18:45:43

7252

APACHE MXNET深度學習框架的概念、工作原理及用例

Apache MXNet 是一個靈活且可擴展的深度學習框架，支持多種深度學習模型、編程語言，并且有一個開發接口，因其易用性而受到高度重視。

2022-06-17 09:23:21

1693

Google的深度學習框架TensorFlow的優勢分析

TensorFlow命名源于其運行原理，即“讓張量（Tensor）流動起來（Flow）”，這是深度學習處理數據的核心特征。TensorFlow顯示了張量從數據流圖的一端流動到另一端的整個計算過程，生動形象地描述了復雜數據結構在人工神經網絡中的流動、傳輸、分析和處理模式。

2022-11-21 10:21:30

1322

TensorFlow和PyTorch的實際應用比較

TensorFlow和PyTorch是兩個最受歡迎的開源深度學習框架，這兩個框架都為構建和訓練深度學習模型提供了廣泛的功能，并已被研發社區廣泛采用。但是作為用戶，我們一直想知道哪種框架最適合我們自己

2023-01-14 11:53:12

2420

深度學習框架PyTorch和TensorFlow如何選擇

在 AI 技術興起后，深度學習框架 PyTorch 和 TensorFlow 兩大陣營似乎也爆發了類似的「戰爭」。這兩個陣營背后都有大量的支持者，并且他們都有充足的理由來說明為什么他們所喜歡的框架是最好的。

2023-02-02 10:28:14

825

深度學習框架:人工智能時代的操作系統

Tensorflow: 谷歌開源的向更加易用發展的主流學習框架

2023-03-15 10:17:25

341

?計算機視覺深度學習訓練推理框架

PyTorch是由Facebook人工智能研究小組開發的一種基于Lua編寫的Torch庫的Python實現的深度學習庫，也是目前使用范圍和體驗感最好的一款深度學習框架。

2023-05-08 14:20:58

774

深度學習框架pytorch入門與實踐

深度學習框架pytorch入門與實踐深度學習是機器學習中的一個分支，它使用多層神經網絡對大量數據進行學習，以實現人工智能的目標。在實現深度學習的過程中，選擇一個適用的開發框架是非常關鍵

2023-08-17 16:03:06

1075

深度學習框架是什么？深度學習框架有哪些？

深度學習框架是什么？深度學習框架有哪些？? 深度學習框架是一種軟件工具，它可以幫助開發者輕松快速地構建和訓練深度神經網絡模型。與手動編寫代碼相比，深度學習框架可以大大減少開發和調試的時間和精力，并提

2023-08-17 16:03:09

1586

深度學習框架區分訓練還是推理嗎

深度學習框架區分訓練還是推理嗎深度學習框架是一個非常重要的技術，它們能夠加速深度學習的開發與部署過程。在深度學習中，我們通常需要進行兩個關鍵的任務，即訓練和推理。訓練是指使用訓練數據訓練神經網絡

2023-08-17 16:03:11

906

深度學習框架的作用是什么

深度學習框架的作用是什么深度學習是一種計算機技術，它利用人工神經網絡來模擬人類的學習過程。由于其高度的精確性和精度，深度學習已成為現代計算機科學領域的重要工具。然而，要在深度學習中實現高度復雜

2023-08-17 16:10:57

1072

深度學習框架pytorch介紹

深度學習框架pytorch介紹 PyTorch是由Facebook創建的開源機器學習框架，其中TensorFlow是完全基于數據流圖的。它是一個使用動態計算圖的框架，允許用戶更靈活地定義和修改模型

2023-08-17 16:10:59

992

深度學習框架tensorflow介紹

深度學習框架tensorflow介紹深度學習框架TensorFlow簡介深度學習框架TensorFlow由Google開發，是一個開放源代碼的深度學習框架，可用于構建人工智能應用程序

2023-08-17 16:11:02

1283

深度學習算法的選擇建議

常重要的。本文將提供一些選擇建議，以及如何決定使用哪種框架和算法。首先，選擇框架。目前，深度學習領域最流行和使用最廣泛的框架有TensorFlow、PyTorch、Keras和Caffe。以下是每個框架的優缺點： TensorFlow：Google開發的一個框架，支持大規

2023-08-17 16:11:05

342

深度學習算法庫框架學習

深度學習算法庫框架的相關知識點以及它們之間的比較。 1. Tensorflow Tensorflow是Google家的深度學習框架，已經成為深度學習領域的“事實標準”。它是個非常強大的庫，主要用于構建和訓練神經網絡。Tensorflow支持多種編程語言，例如

2023-08-17 16:11:07

412

深度學習框架對照表

的深度學習框架，并對它們進行對比。 1. TensorFlow TensorFlow是由Google Brain團隊開發的一款深度學習框架，目前是深度學習領域中最常用的框架之一。 TensorFlow 主要的優勢是其可擴展性和豐富的社區支持，擁有非常強大的計算圖優化、自動微分

2023-08-17 16:11:13

458