本日Reddit熱議:開源機器學習管理平臺TRAINS。據開發者介紹,該平臺能夠通過中央服務器集中記錄管理ML模型的一切信息,整合方便,與主流框架無縫對接,僅用兩行代碼即可啟用,相關Demo和GitHub資源已開放。
今天Reddit頭號熱帖看起來像是一條廣告:這是一個ML團隊自家開發的模型管理平臺,名字很別致,叫“TRAINS”,很直觀有沒有?
帖子作者是開發團隊成員之一,上來第一句就很耿直:現在機器學習模型管理平臺很多,要不要來試試我們剛開源這個?
簡單介紹一下,這個平臺名叫TRAINS,我們團隊沒有營銷team,所以我作為開發團隊一員,先發到reddit上讓你們先試試看了!
你這平臺最大特點是啥?使用簡便!只需在腳本中添加兩行代碼,模型、性能指標、超參數就盡在掌握了。
話說回來,只要分享的東西好用,作為“美國貼吧”的Reddit上的網友其實并不拒絕廣告,下邊網友就開始提問了,比如:
我現在還沒進GitHub里詳細查看,不如你簡單介紹一下這個TRAINS平臺和現有其他機器學習模型管理平臺,比如和Sacred的區別、或者說是特別之處在哪兒呢?
Sacred平臺模型調試面板
樓主表示這個問題問的好。他表示,主要有六點區別:
TRAINS整合整個資源庫只需兩行代碼,如果是Scared的話,需要為每個函數添加修飾器,記錄每個量度和超參數,顯示整合非常麻煩。
TRAINS還會自動將git repo和commit與實驗中的訓練過程連接起來。(據我所知,這在Sacred中是辦不到的,至少不容易實現)
TRAINS自動記錄模型并在集中的位置創建副本,團隊可以輕松地對模型和初始權重進行共享。(使用Sacred只能手動執行操作,只能在共享文件夾上共享。)
TRAINS界面美觀,連續幾小時看著不累眼睛。
TRAINS允許用戶從Python式的界面中輕松查詢實驗數據和指標。
TRAINS還允許用戶直接訪問mongoDB和elasticsearch數據庫,以便更深入地了解系統。
不過,作者Reddit上的回復中對TRAINS的介紹比較簡略,我們還可以去GitHub上看看。
GitHub上的介紹就直接多了,介紹說明文檔中直接將TRAINS稱為一套“神奇的自動化AI實驗管理器和版本控制器。”
即使是才華橫溢的科學家,工程師或開發人員,在獨立工作時都難免被復雜的流程搞得一團亂麻。機器學習的工作流程是可以管理的。隨著時間的推移和項目人手的增加,管理的混亂會降低生產力。隨著項目向生產方向發展,必須通過可見性和出處(provenance)來擴展深度學習的研究成果。
不論是對于團隊還是企業,TRAINS都能將所有內容記錄在一個中央服務器中,并實現可視化和出處,這樣生產力就不會受到影響。TRAINS可以記錄和管理各種深度學習研究的模型負載,并且幾乎不需要付出集成成本。
我們專門設計了TRAINS,能夠輕松集成模型參數,團隊可以保留現有的方法和實踐。可以每天使用TRAINS來增強團隊協作,提升可視化程度,還可以用來將實驗日志、輸出和數據收集到一個集中式的中央服務器上。
Demo地址:https://demoapp.trainsai.io (需要注冊)
究竟神奇在哪呢?以下是作者團隊總結的TRAINS的主要特點。
TRAINS是我們解決機器學習/深度學習領域中與無數其他研究人員和開發人員分享的問題的方法:培訓生產級深度學習模型是一個光榮而又混亂的過程。TRAINS通過關聯代碼版本控制、研究項目、性能指標和模型出處來跟蹤和控制流程。
無縫兼容常用框架,一站式記錄所有模型數據
現在就能用
TRAINS免費開源,只需要兩行代碼即可完全集成。
可與其他常用工具一起使用
TRAINS與現有主要框架無縫集成,包括:PyTorch、TensorFlow、Keras和其他即將推出的框架支持Jupyter Notebook和PyCharm遠程調試
TRAINS服務器和使用TRAINS python包的GPU訓練機器的交互過程
記錄一切:讓機器學習實驗真正可重復
自動關聯模型+代碼+參數+初始權重的模型日志記錄
自動在集中存儲上創建模型副本(支持共享文件夾、S3、GS,Azure即將推出!)
共享與合作
多用戶過程跟蹤與合作
中心服務器能夠整合日志、記錄和通用統計數據
提高生產力
全面的實驗數據比對,代碼貢獻、初始權重、超參數和量度結果等。
組織與管理
管理并組織項目中的實驗
查詢能力。通過結果量度對實驗進行分類和篩選。
更多特色
通過網頁應用,利用遠程機器終止實驗
提供經過現場測試的功能豐富的SDK,可滿足用戶的即時定制化需求
有關TRAINS機器學習模型管理平臺的更多詳情,可參閱GitHub資源:https://github.com/allegroai/trains
-
開源
+關注
關注
3文章
3676瀏覽量
43797 -
代碼
+關注
關注
30文章
4899瀏覽量
70660 -
機器學習
+關注
關注
66文章
8501瀏覽量
134553
原文標題:Reddit熱議:只要2行代碼,免費開源ML管理工具TRAINS
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
微電網能源管理物聯網平臺具備什么功能
AI集成運維管理平臺的架構與核心構成解析
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品
深度解讀英偉達Newton機器人平臺:技術革新與跨界生態構建

開源mlops平臺好用嗎
靈汐科技開源類腦深度學習應用開發平臺BIDL

安川(YASKAWA)機器人智能管理平臺有哪些功能
如何選擇云原生機器學習平臺
什么是云原生MLOps平臺
什么是機器學習?通過機器學習方法能解決哪些問題?

評論