為什么這三家公司最終都不約而同地放棄 TensorFlow ,而轉向了 PyTorch?
深度學習框架 PyTorch 憑借其相對易用性,已經滲透到了企業中。本文提到的三家公司告訴我們,為什么他們選擇 PyTorch 而不是 Google 著名的 TensorFlow 框架。
深度學習 是機器學習的一個子類別,它使用多層神經網絡將歷史上很難完成的機器任務——比如 圖像識別、自然語言處理 和 機器翻譯——實現大規模自動化。
自 2015 年以來,TensorFlow 就從 Google 中脫穎而出,在研究和商業領域成為最受歡迎的開源深度學習框架。但是 2016 年從 Facebook 誕生的 PyTorch 由于社區推動的易用性改進和越來越廣泛的用例部署,而迅速 趕上TensorFlow。
在汽車行業,PyTorch 的應用尤為廣泛——它可以應用于 Tesla 和 Lyft Level 5 等公司的實驗性自動駕駛系統。該框架也被媒體公司用來對內容進行分類和推薦,并在工業應用中支持機器人。
Facebook AI 的人工智能產品主管 Joe Spisak 告訴 InfoWorld,雖然他對企業采用 PyTorch 的人數增加感到高興,但要擴大行業應用范圍,還有很多工作要做。
“MLOps 和 Kubeflow 管道以及這些社區的支持將會帶來新一輪的采用浪潮,”他說。“對于那些剛起步的人來說,這些工具都相當不錯,它們使用了托管服務和一些開源的東西,比如 AWS 的 SageMaker 或 Azure ML。”
Disney:識別電影中的動畫面孔
自 2012 年以來,媒體巨頭 Disney 的工程師和數據科學家一直在構建該公司所謂的“內容基因組”(Content Genome)的知識圖譜,將內容元數據聚合在一起,從而推動 Disney 龐大的內容庫中基于機器學習的搜索和個性化應用。
“這個元數據改進了 Disney 故事講述者用于制作內容的工具;激發故事中的迭代創新;通過推薦引擎,數字導航和內容發現提高用戶體驗;并實現了商業智能。”Disney 的開發人員 Miquel±ngel Farré、Anthony Accardo、Marc Junyent、Monica Alfaro 和 Cesc Guitart 在 今年 7 月的一篇博客文章 中寫道。
在這之前,Disney 不得不投資一個龐大的內容注釋項目,求助于其數據科學家,利用深度學習的圖像識別模型,訓練一個自動化標記管道,以識別海量的人物,地點和地點圖像。
Disney 的工程師們最初嘗試了包括 TensorFlow 在內的各種框架,但在 2019 年,他們決定將 PyTorch 與之結合起來。工程師們從傳統的 方向梯度直方圖(histogram of oriented gradients,HOG)特征描述器和流行的 支持向量機(support vector machines,SVM)模型,轉向了被稱為 基于區域卷積神經網絡(regions with convolutional neural networks,R-CNN)的目標檢測架構版本。在處理 Disney 內容中常見的真人動作、動畫和視覺效果的組合時,后者更為有利。
“在動畫片中很難定義什么是人臉,所以我們轉向深度學習方法,使用目標檢測器,并使用遷移學習。”Disney 研究工程師 Monica Alfaro 向 InfoWorld 解釋道。在僅僅處理了幾千張人臉之后,新模型已經能夠大致識別所有三種用例中的人臉。它于 2020 年 1 月投入生產。
她表示:“我們現在只使用一種模型來識別三種類型的人臉,這對于像《復仇者聯盟》這樣的漫威電影來說是很棒的。因為在這類電影中,鋼鐵俠和 Tony Stark 或者任何一個戴面具的角色都需要被識別出。”
由于工程師要處理如此大量的視頻數據以并行地訓練和運行模型,所以他們也希望在投入生產階段時,能夠運行在昂貴的高性能 GPU 上。
從 CPU 的轉變讓工程師可以更快地重新訓練和更新模型。它還加快了向 Disney 各個小組分發測試結果的速度,將處理時間從一部長篇電影的大約一個小時縮短到今天的 5 到 10 分鐘。
“TensorFlow 目標檢測器在生產環境中會存在內存問題,并且很難更新;而 PyTorch 有同樣的目標檢測器和 Faster-RCNN,因此我們開始使用 PyTorch 來解決所有的問題。”Alfaro 說。
對工程團隊來說,這種從一個框架到另一個框架的轉換也出奇地簡單。“(改用 PyTorch)很容易,因為它都是內置的,你只需要插入一些功能,就可以快速上手,所以它的學習曲線并不陡峭。”Alfaro 說。
當他們遇到任何問題或瓶頸時,充滿活力的 PyTorch 社區隨時提供幫助。
Blue River Technology:除草機器人
Blue River Technology 設計了一款機器人,這種機器人結合了數字尋路、集成攝像頭和計算機視覺技術,可以在農作物不受影響的情況下,在近乎實時的環境給雜草噴灑除草劑,幫助農民更有效地節約昂貴且可能對環境造成破壞的除草劑。
這家位于加利福尼亞州森尼韋爾的公司在 2017 年吸引了重型設備制造商 John Deere 的關注,當時該公司以 3.05 億美元的價格被 收購,目的是將該技術整合到其農業設備中。
Blue River Technology 的研究人員利用各種深度學習框架進行了試驗,試圖訓練計算機視覺模型來識別雜草和農作物之間的差異,這對處理棉花植物來說是一個巨大的挑戰,因為棉花植物不幸地與雜草相似。
Blue River Technology 的計算機視覺和機器學習主管 Chris Padwick 在他 8 月份的一篇 博客文章 中寫道,訓練有素的農藝師被征召來執行人工圖像標注任務,并使用 PyTorch 訓練 卷積神經網絡(CNN),以“分析每一幀圖像,并生成像素級精度的地圖,顯示農作物和雜草所在的位置”。
“像其他公司一樣,我們也試過 Caffe、TensorFlow 和 PyTorch,”Padwick 告訴 InfoWorld。“對我們來說,這幾乎是一種開箱即用的方法,我們既沒有收到過任何 bug 報告,也沒有出現過阻塞 bug。在分布式計算中,它真的很亮眼,它的性能確實比 TensorFlow 要好,TensorFlow 在數據并行方面相當復雜。”
Padwick 表示,PyTorch 框架的普及和簡單性使得他在快速招聘新員工方面具有優勢。話雖如此,Padwick 仍然夢想著這樣一個世界:“人們可以在自己喜歡的環境中進行開發。”有些人喜歡用 Apache MXNet、Darknet 或 Caffe 進行研究,但是在生產環境中,它們只能使用單一語言,而 PyTorch 擁有我們成功所需的一切。”
Datarock:基于云端的采礦業圖像分析
Datarock 是由一群地球科學家創立的澳大利亞初創公司,正在將 計算機視覺 技術應用于采礦業。更具體地說,它的深度學習模型正在幫助地質學家比以前更快地分析鉆探巖心樣本圖像。
通常,地質學家會一厘米一厘米地仔細研究這些樣品,以評估礦物學和結構;而工程師則會尋找諸如斷層、裂縫和巖石質量等物理特征。這一過程是緩慢的,而且很容易出現人為錯誤。
Datarock 的首席運營官 Brenton Crawford 告訴 InfoWorld:“計算機可以像工程師一樣看到巖石。如果你能在圖像中看到,我們就可以訓練一個模型去分析它,就像訓練一個人類一樣。”
與 Blue River 類似,Datarock 在生產環境中使用了 RCNN 模型的一種變體,研究人員轉向數據增強技術,以便在早期階段收集足夠的訓練數據。
“在最初的發現期之后,團隊開始將各種技術結合起來,為鉆探巖心圖像創建一個圖像處理工作流程。這項工作包括開發一系列深度學習模型,能夠將原始圖像處理為結構化格式,并分割重要的地質信息。”研究人員在一篇 博客文章 中寫道。
通過 DataRock 的技術,客戶只需半小時就能得到結果,而手工記錄結果需要五、六小時。Crawford 說,這樣可以使地質學家不再從事更繁重的工作。但是,“當我們將更困難的事情實現自動化時,我們確實會受到一些阻力,不得不解釋為什么要把它們作為訓練模型和使反饋循環轉動的系統的一部分。”
和許多公司訓練深度學習計算機視覺模型一樣,Datarock 也是從 TensorFlow 開始的,但很快就轉向了 PyTorch。
Datarock 的機器學習主管 Duy Tin Truong 告訴 InfoWorld:“一開始我們使用的是 TensorFlow,但是由于某些神秘的原因它會崩潰。”他說,“當時 PyTorch 和 Detecton2 剛剛發布,非常符合我們的需求,所以經過一些測試之后,我們發現它更容易調試和工作,而且占用的內存也更少,所以我們進行了轉換。”
Datarock 還報告說,當在 GPU 上運行模型時,從 TensorFlow 到 PyTorch 和 Detectron2 的推理性能提高了 4 倍,而在 CPU 上則提高了 3 倍。
Truong 列舉了 PyTorch 不斷增長的社區、設計良好的界面、易于使用和更好的調試作為切換的理由,并指出,盡管“從界面的角度來看,它們是完全不同的,但如果你懂 TensorFlow,那么切換起來是相當容易的,特別是如果你了解 Python 的時候。”
作者介紹:
Scott Carey,經驗豐富的多媒體記者,專注于科技、旅游、體育、文化和社交媒體。目前是記者和編輯,管理著一支由 B2B 記者組成的優秀團隊,并且具有豐富的數字技能,在為網絡和紙媒撰稿、報道事件、電視記者和電臺記者方面的經驗。
責任編輯:lq
-
機器人
+關注
關注
213文章
29508瀏覽量
211637 -
深度學習
+關注
關注
73文章
5555瀏覽量
122499 -
tensorflow
+關注
關注
13文章
330瀏覽量
61038
原文標題:始于TensorFlow ,終于PyTorch
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
淺談生成式AI的應用場景
折疊屏手機報告出爐,前五被三家公司瓜分

評論