吳恩達一生中有很多頭銜,你也許知道他是谷歌大腦團隊的創始人,或者是百度的前首席科學家。你也許是上過他的課,通過廣受歡迎的在線課程,他向無數學生、好奇的聽眾和商業領袖傳授了機器學習的原理。
目前,他在 2017 年創立的最新創業項目 Landing AI 中,探索沒有龐大數據集可供利用的企業如何加入 AI 革命。
3 月 23 日,吳恩達在《麻省理工技術評論》的虛擬 EmTech Digital 峰會上分享了他的經驗教訓。
《麻省理工技術評論》:我敢肯定人們經常問你:“怎么建立一個以 AI 為先的企業呢?”你通常會怎么回答呢?
吳恩達:我通常會說:“不要那樣做”。如果我在帶一個團隊,就會說:“嘿,大家請以人工智能為先” ,團隊就會把重點放在技術上,這也許對一個研究實驗室來說挺好的。但做生意時,我一般是以客戶或任務為導向,幾乎沒有以技術為導向過。
《麻省理工技術評論》:你建立了這個叫作 Landing AI 的新創業項目。你能告訴我們這個項目是什么嗎?以及你為什么選擇做這個項目?
吳恩達:在谷歌和百度帶過 AI 團隊后,我意識到 AI 已經改變了消費類軟件互聯網,比如網絡搜索和在線廣告,但我想把 AI 運用到其他所有行業,這在經濟中占更大比重。
所以在研究了很多不同行業之后,我決定從制造業下手。我覺得很多行業已經具備了創建 AI 的條件,但一個行業創建 AI 條件更成熟的一個模式就是它正在經歷數字轉型,這樣就會有一些數據,這為 AI 團隊利用數據創造價值提供了機會。
我最近很感興趣的一個項目是制造視覺檢測,看著從生產線上下來的智能手機的圖片,你能看出圖片有沒有缺陷呢?或者能看出汽車部件上有沒有凹痕呢?
一個巨大的區別是在消費類軟件互聯網上,也許你有 10 億用戶和大量的數據。但在制造業,沒有一家工廠生產過 10 億部甚至 100 萬部刮花的智能手機。所以挑戰是你能用 AI 處理 100 張圖像嗎?
事實證明,你可以做到,用少量的數據就可以做這么多事情,我每次都驚嘆不已。所以,盡管所有圍繞 AI 的宣傳、熱度和公關都是以巨大的數據集為賣點,但我覺得我們也還有很大的發展空間來開創其他挑戰大不相同的應用程序。
《麻省理工技術評論》:你是怎么運營這個項目的?
吳恩達:我看到首席執行官和首席信息官經常犯的一個錯誤是,他們對我說:“嘿,安德魯,我們沒有那么多數據,我的數據一團糟。所以給我兩年時間來建立一個完善的 IT 基礎設施,這樣我們就有了構建 AI 所需的海量數據。”我總回答道:“這是錯的。別這么做。”
首先,我認為當今世界上沒有一家公司,甚至是科技巨頭會覺得他們的數據是完美無瑕的,這是一個過程。而花 2-3 年時間構建一個漂亮的數據基礎設施,意味著你沒有 AI 團隊的反饋,來幫助你優先考慮要構建什么樣的 IT 基礎設施。
例如,如果你有很多用戶,你是否應該優先給他們做調查問卷來獲得更多數據?或者在工廠里,你是否應該優先升級傳感器,從記錄每秒 10 次震動到每秒 100 次震動?通常情況下,在開始 AI 項目時,你掌握的數據能夠讓 AI 團隊給你提供反饋,幫助你優先考慮還要收集哪些數據。
在不具備消費類軟件互聯網規模的行業,我覺得我們需要從大數據轉向優質數據。如果你有一百萬張圖片,那就用吧。但使用小得多、標簽清晰、精心整理的數據集就會出現很多問題。
《麻省理工技術評論》:你能舉個例子嗎?你說的優質數據是什么意思?
吳恩達:我先舉一個語音識別的例子,我在使用語音搜索時,會聽到有人說,“嗯,今天的天氣”的音頻片段,問題是這個音頻片段該怎么正確轉錄呢?是“嗯,今天的天氣”,還是“嗯、、、今天的天氣”呢?抑或是“嗯”這個詞我們沒抄下來?
其實這三種都可以,但不同的轉錄器用這三種標記方式就有問題了,這樣數據就會有噪音,損害語音識別系統。現在,你有數百萬或 10 億用戶時,就可以把那些噪音數據平均分配一下——學習算法就可以很好做到這一點。但如果你的數據集比較小的話,如 100 個例子,那這類噪音數據會讓效果大打折扣。
還有一個是制造業的例子:我們在鋼材檢驗方面做了很多工作。如果你開一輛側面曾經是用鋼板做的車,有時鋼板上會有一些小褶皺、小凹痕或斑點,你就可以用相機和計算機視覺來檢查是否有缺陷。
但不同的貼標人員會對數據進行不同的標記,有些人會在整個區域周圍放一個巨大的限位框,有些人會在小粒子周圍設置小小的限位框。當你的數據集很小時,確保不同的質檢人員統一標記數據是最重要的事情之一。
對很多 AI 項目來說,你從 GitHub 上下載的開源模型——你可以從文獻中獲得的神經網絡——(這)已經夠好了,(雖然)這不能解決所有問題,但可以解決主要問題。所以我跟我團隊很多人說,“嘿,大家,神經網絡已經夠好了。我們不要再攪亂代碼了。你們現在唯一要做的就是建立流程來提高數據質量。”事實證明,這通常能讓算法的性能提高得更快。
《麻省理工技術評論》:你提到較小的數據集時,是指多大的數據?一百個例子?還是十個例子?
吳恩達:機器學習太多樣化了,很難給出一刀切的答案。我曾經處理過有 2 億到 3 億張圖片的問題,也處理過只有 10 張圖片的問題,以及介于這兩者之間的我也都處理過。我觀察制造業應用程序時,我認為一個缺陷類有幾十或上百個圖像是很正常的,但即使在工廠內部也有很大的差異。
我確實發現,訓練集的規模低于比如說 10000 個例子時,AI 實踐就會切換,因為這是一個閾值,工程師基本可以查看每個例子,自己設計、然后做出決定。
最近,我和一位非常出色、在一家大型科技公司工作的工程師聊天。我問他:“嘿,如果標簽不一致的話你會怎么辦?”他回答道:“嗯,我們在海外有幾百人的團隊做標簽,所以我會寫下標簽說明,讓三個人給每張圖片貼上標簽,然后我取一個平均值。”我說:“是的,數據集很大時就得這么做。”但我和一個較小的團隊合作時,如果標簽不一致,我就會找到這兩個意見不一致的人,讓他們打一個 Zoom 視頻電話,互相交談一下,試圖達成一個解決方案。
《麻省理工技術評論》:現在我想請你談談對一般 AI 產業的看法。我收集了我們讀者想問你的問題。一位讀者問道:AI 的發展似乎主要分兩種方向,一種是學術研究,一種是大規模、資源密集型的大公司項目,如 OpenAI 和 DeepMind。這并沒有給小型創業公司留下太多的空間。你認為小公司可以關注哪些實際問題來推動 AI 的真正商業應用呢?
吳恩達:我認為很多媒體都把注意力放在大公司上,有時也放在大型學術機構上。但如果你參加學術會議,就會發現很多工作是由小型研究小組和研究實驗室完成的。我和不同公司各行各業的人士交談時,我覺得他們可以利用 AI 來解決很多商業應用問題。我通常去問商業領袖:“你們最大的商業問題是什么?你最擔心的事情是什么?”這樣我就能更好理解企業的目標,然后集思廣益是否有 AI 解決方案,有時找不到解決方案的話,那也沒關系。
也許我要提幾個我覺得興奮的差異,我認為今天構建 AI 系統仍然需要大量的手工操作。你有一些聰明的機器學習工程師和數據科學家在計算機上做事情,然后把事情推向生產,在這個過程中有很多手動步驟。因此,我對 ML Ops(機器學習操作)感到興奮,因為這是一門新興學科,有助于讓構建和部署 AI 系統的過程更加系統化。
此外,如果你看看許多典型的商業問題(從營銷到人才)的所有職能,就會發現自動化和效率提高的空間很大。
我也希望 AI 社區能夠關注最大的社會問題,看看我們能為氣候變化、無家可歸或貧困做些什么。除了有時非常有價值的商業問題,我們也應該致力于最大的社會問題。
《麻省理工技術評論》:你如何確定是否有機會在你的企業中進行機器學習呢?
吳恩達:我會試著自己學習一些商業知識,也會試著幫助商業領袖學習一些有關 AI 的知識,然后我們通常會集思廣益一組項目,對于每個想法,我會同時在技術和業務上作出努力。我們將著眼于:你是否有足夠的數據?精度是多少?您將其部署到生產環境中時,是否存在長尾現象?你如何填充數據,為持續學習形成閉合回路?所以要確保問題在技術上是可行的。然后是商業方面做出的努力:我們要確保這會實現我們期待的投資回報率。在這個過程之后,你通常要做這樣的事情,比如評估資源、里程碑。
另一個建議是:開始要快,這很重要,從小處開始也沒關系。我在谷歌第一個有意義的商業應用程序是語音識別,而不是網絡搜索或廣告,但幫助谷歌語音團隊提高語音識別的準確度,給大腦團隊確立了信譽以及提供必要的資金去追求更大的合作伙伴。
所以谷歌地圖是我們第二大合作伙伴,我們使用計算機視覺,讀取房屋號碼,在谷歌地圖上定位房屋。只有在前兩個項目成功之后,我才與廣告團隊好好探討了一下。我想我看到過很多公司因為起步太大而失敗,這比起步太小而失敗的要多。作為一個組織,你可以先做一個較小的項目,了解一下使用AI的感覺,然后再繼續做大。
《麻省理工技術評論》:為了在自己的公司里實現 AI,我們的用戶明天應該開始做一件什么事?
吳恩達:投入。AI 正在改變許多行業的格局,所以,如果你的公司還沒有做出非常浩大和明智的投資,這是一個好時機。
原文標題:吳恩達:不要建立AI先行的企業,而要從任務導向開始 | 專訪
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
AI
+關注
關注
88文章
35164瀏覽量
280018 -
機器學習
+關注
關注
66文章
8503瀏覽量
134635
原文標題:吳恩達:不要建立AI先行的企業,而要從任務導向開始 | 專訪
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
恩智浦如何實現負責任的邊緣AI
IBM攜手英偉達AI數據平臺推動企業級AI創新
恩智浦擬收購邊緣AI企業Kinara
恩智浦擬22.44億人民幣收購邊緣NPU企業Kinara
英偉達收購AI初創公司Run:ai
企業AI模型部署攻略
英偉達與印度大企業聯手,共謀AI未來
英偉達著手構建AI大腦,推動企業管理智能化

傳感器+AI,融了7個億,華為基恩士博世……都在搞AI傳感器

評論