2016年8月30日,OpenAI 研究員在博客發文,結合實例介紹了 OpenAI 進行深度學習研究時采用的基礎設施配置,并且提供了相關開源代碼。文章激起了很多反響,相對于軟硬件開源,OpenAI 從另一個側面,對深度學習模型的實際部署提供了幫助。
3.OpenAI 重磅發布 AGI 測試訓練平臺 Universe
2016年12月4日,在今年 NIPS 大會召開的前一晚,OpenAI 發布了 Universe,用于訓練解決通用問題 AI 的基礎架構。據悉,這是一個能在幾乎所有環境中衡量和訓練 AI 通用智能水平的開源平臺,目標是讓智能體能像人一樣使用計算機。目前,Universe 已經有1000種訓練環境,由微軟、英偉達等公司參與建設。有了 Universe,任何程序都能被接入到 OpenAI Gym 的環境中。很快,OpenAI 還推出了 Mini World of Bits(MiniWoB),這個與 OpenAI Universe 配套的環境基準可以測試代理與常見網頁瀏覽器元素的交互能力,比如按鈕、文本框、滑塊。
微軟開源:CNTK 升級版
根據 Github 2016年度的《Octoverse 觀察報告》,微軟不僅是擁有開源項目最多的公司,也是貢獻人數最多的公司。
在人工智能方面,微軟的開源項目有很多,包括 CNTK計算網絡工具包、DMTK分布式機器學習工具包,Send2vec語義相似映射器, 以及 CodaLab 研究平臺(基于Web的開源平臺,旨在通過其在線社區幫助解決數據導向的許多常見問題,從而促進機器學習和高性能計算的研究領域的發展)。
2016年10月27日,微軟開源深度學習認知工具包 CNTK 升級版,其中最矚目的功能是增加了 Python 綁定,支持增強學習。新版的 CNTK 性能大幅提升,尤其是在多臺機器上處理較大數據集的情況下能高速運行,這種類型的大規模部署對于多GPU上的深度學習是不可或缺的,也是開發消費產品和專業產品的必需。
微軟研究人員表示,在多服務器間運行的能力是一大進步。CNTK 升級版還包含了一些算法,用于將大規模數據處理的計算消耗降到最低。
百度
1.百度開源深度學習代碼 Warp-CTC 詳解
2016年1月15日,百度公布了代碼 Warp-CTC,能夠讓 AI 軟件運行得更高效。說 Warp-CTC 知道的人可能還少,百度語音識別系統 Deep Speech 2就是用它搭建的。百度位于硅谷的 AI 實驗室主管 Adam Coates 在接受 Re-Work 采訪時表示,他們在構建深度語音端對端系統的過程中發明了Warp-CTC 方法,進而使用 CTC 提高模型的可伸縮性。“由于沒有相似的工具,我們決定將其分享給人們。它是一款很實用的工具,可以用到現有的AI框架中。現在有很多深度學習的開源軟件,但是之前用于訓練序列數據的端對端網絡一直很慢。我們在Warp-CTC上的投入是對“我們堅信深度學習與高性能計算技術(HPC)的結合會有巨大潛力”的一種證明。”
2.百度開源分布式深度學習平臺,挑戰 TensorFlow(附教程)
2016年8月31日,百度宣布開源深度學習平臺 PaddlePaddle。實際上,百度深度學習實驗室在幾年前就投入 PaddlePaddle 的開發,業內對這個云端托管的分布式深度學習平臺贊譽有加:代碼簡潔、設計干凈,沒有太多抽象……PaddlePaddle 對于序列輸入、稀疏輸入和大規模數據的模型訓練有著良好的支持,支持GPU運算,支持數據并行和模型并行,僅需少量代碼就能訓練深度學習模型,大大降低了用戶使用深度學習技術的成本。
3.百度公開硬件基準 DeepBench,推動深度學習專用芯片研發競爭
2016年9月,百度發表論文,開源 DeepBench 基準測試,AI研究者和芯片制造商可以用它測試不同的芯片運行軟件時的性能,尤其是哪款硬件加速深度學習性能最好。目前 DeepBench 只能測試深度學習的訓練模型,能提供在三種 Nvidia GPU和一種 Intel Xeon Phi 處理器的基準化測試結果,未來還可能測試用于圖像和語音識別之類任務的“推理”模型。百度希望 DeepBench 能促進特定任務深度學習加速器的研發,“GPU顯然不是終點,我們希望這能鼓勵競爭”。
GitHub 最受歡迎的深度學習項目
名稱星數簡介
TensorFlow
29622
使用數據流圖計算可擴展機器學習問題
Caffe
11799
一個高效的開源深度學習框架
Neural Style
10148
由Torch實現的神經網絡算法
Deep Dream
9042
一款圖像識別工具
Keras
7502
一款由Python實現的深度學習庫,包括卷積神經網絡、遞歸神經網絡等。運行在Theano和TensorFlow之上
Roc AlphaGo
7170
由學生主導的一個獨立項目,重新實現了 DeepMind在2016發表于Nature論文"Mastering the game of Go with deep neural networks and tree search(用深度神經網絡和樹搜索學習圍棋)" (Nature 529, 484-489, 28 Jan 2016)
TensorFlow Models
6671
基于TensorFlow開發的模型
Neural Doodle
6275
運用深度神經網絡將涂鴉變為優雅的藝術品,從照片生成無縫紋理,轉變圖片風格,進行基于實例的提升,等等。(語義風格傳遞的實現)
CNTK
5957
微軟的計算網絡工具(Computational Network Toolkit,CNTK)
TensorFlow Examples
5872
面向初學者的TensorFlow教程和代碼示例
ConvNet JS
5231
基于Java的深度學習庫。在瀏覽器中訓練卷積神經網絡模型(或者普通模型)
Torch
5133
Torch7,深度學習庫
OpenFace
4855
基于深度學習網絡的面部識別
MXNet
4685
輕巧、便攜、靈活的分布式/移動深度學習框架,支持Python, R, Julia, Scala, Go, Java等等語言
Nupic
4364
智能計算的Numenta平臺(Numenta Platform for Intelligent Computing,Nupic):一個腦啟發式的計算智能和機器智能平臺,基于皮層學習算法的生物精確神經網絡模型
Theano
4286
一個 Python 庫,用來定義、優化和模擬數學表達式計算,用于高效解決多維數組的計算問題
Leaf
4281
面向黑客的開源機器智能框架
Char RNN
3820
基于Torch開發的多層遞歸神經網絡的字符級別語言模型
Neural Talk
3694
一個Python+numpy項目,用多模式遞歸神經網絡描述圖像
deeplearning4j
3673
基于Hadoop和Spark的Java, Scala & Clojure深度學習工具
TFLearn
3368
深度學習庫,包括高層次的TensorFlow接口
TensorFlow Playground
3352
神經網絡模型示例
OpenAI Gym
3020
一種用于開發和比較強化學習算法的工具包
Magenta
2914
用機器智能生成音樂和藝術
Colornet
2798
用神經網絡模型給灰度圖上色
Synaptic
2666
基于node.js和瀏覽器的免架構神經網絡庫
Neural Talk 2
2550
Torch開發的圖像簡介生成GPU運行代碼
Image Analogies
2540
使用神經匹配和融合生成相似圖形
TensorFlow Tutorials
2413
Tensorflow的基礎原理到應用
Lasagne
2355
基于Theano訓練和構建神經網絡的輕型函數庫
PyLearn2
2153
基于Theano的機器學習庫
LISA-lab Deep Learning Tutorials
2134
深度學習教程筆記和代碼
Neon
2121
Nervana 開發的一款快速、可擴展、易使用的Python深度學習框架
Matlab Deep Learning Toolbox
2032
Matlab/Octave的深度學習工具箱。包括深度信念網絡、自動編碼機、卷積神經網絡、卷積自動編碼機和vanilla神經網絡等。每種方法都有入門示例
Deep Learning Flappy Bird
1721
使用深度強化學習破解Flappy Bird游戲
Chainer
1573
一款靈活的深度學習神經網絡框架
Neural Story Teller
1514
一種根據圖片生成故事的遞歸神經網絡模型
DIGITS
1353
深度學習GPU訓練系統
Deep Jazz
1229
基于Keras和Theano生成jazz的深度學習模型
Brainstorm
1143
快速、靈活、有趣的神經網絡
Darknet
937
C語言版本的開源神經網絡
Theano Tutorials
904
基于Theano的機器學習入門教程,從線性回歸到卷積神經網絡
RNN Music Composition
904
一款生成古典音樂的遞歸神經網絡工具
Blocks
866
一種用于構建和訓練神經網絡模型的Theano框架
TDB
860
TensorFlow的交互式、節點調試和可視化的工具
Scikit Neural Net
849
深度神經網絡入門工具,類似scikit-learn的分類器和回歸模型。
Veles
760
分布式機器學習平臺(Python, CUDA, OpenCL)
Deep Detect
759
基于C++11的深度學習接口和服務器,與Python綁定并支持Caffe
TensorFlow DeepQ
759
基于Google Tensorflow的deep Q learning演示
Caffe on Spark
724
基于Spark的Caffe
Nolearn
702
神經網絡庫的抽象,著名的Lasagne
DCGAN TensorFlow
568
基于tensorflow實現的深度卷積生成對抗網絡
MatConvNet
479
MATLAB卷積神經網絡工具箱,用于計算機視覺應用
DeepCL
413
用于訓練深度卷積神經網絡模型的OpenCL庫
Visual Search Server
304
用Tensorflow Inception 模型和近似最近鄰的視覺搜索
評論