機器學習使計算機能夠處理迄今為止僅由人執(zhí)行的任務。從駕駛汽車到翻譯語言,機器學習正在推動人工智能爆炸式的增長,幫助軟件理解混亂而不可預知的真實世界。
但究竟什么是機器學習,又是什么讓機器學習現(xiàn)在如此繁榮呢?
什么是機器學習?
在很高的水平上,機器學習是教授計算機系統(tǒng)如何在饋入數(shù)據(jù)時做出準確預測的過程。
這些預測可以回答一張照片中的水果是香蕉還是蘋果,發(fā)現(xiàn)在自動駕駛汽車前橫過馬路的人,電子郵件是否是垃圾郵件,或足夠準確的識別語音以生成YouTube視頻的標題。
與傳統(tǒng)計算機軟件的主要區(qū)別在于,人類開發(fā)人員沒有編寫代碼來指導系統(tǒng)如何區(qū)分香蕉和蘋果之間的區(qū)別。相反,機器學習模式通過對大量數(shù)據(jù)進行訓練來準確地區(qū)分果實,在這種情況下會有大量標記為香蕉或蘋果的圖像。
AI和機器學習有什么不同?
機器學習可能已取得了巨大成功 ,但那只是實現(xiàn)人工智能的方式之一。在20世紀50年代人工智能領域誕生之時,人工智能被定義為任何能夠執(zhí)行具有人類智慧任務的機器。
人工智能系統(tǒng)通常至少會展示以下特征中的一部分:規(guī)劃,學習,推理,解決問題,知識表達,感知,動作和操縱,以及社交智能和創(chuàng)造力。
除了機器學習外,還有其他各種用于構建AI系統(tǒng)的方法,包括進化計算,其中算法經(jīng)歷隨機變異和代之間的組合以試圖“演變”為最優(yōu)解決方案。以及專家系統(tǒng),其中計算機按規(guī)則進行編程允許它們模仿特定領域的專家,例如駕駛飛機的自動駕駛系統(tǒng)。
機器學習有哪些主要類型?
機器學習分為兩大類:有監(jiān)督學習和無監(jiān)督學習。
什么是監(jiān)督學習?這種方法基本上都是通過例子來學習。
在監(jiān)督學習訓練期間,系統(tǒng)暴露于大量被標記的數(shù)據(jù),例如標明了對應數(shù)字的手寫數(shù)字圖像。給出足夠的例子,監(jiān)督學習系統(tǒng)將學會識別與每個數(shù)字相關的像素和形狀,并且最終能夠識別手寫數(shù)字,能夠可靠地區(qū)分數(shù)字9和4或6和8。
但是,對這些系統(tǒng)進行訓練通常需要大量標記數(shù)據(jù),有些系統(tǒng)甚至需要暴露于數(shù)百萬個示例才能掌握任務。
因此,用于培訓這些系統(tǒng)的數(shù)據(jù)集可能非常龐大,Google的開放圖像數(shù)據(jù)集包含大約900萬個圖像,其帶有標簽的視頻存儲庫YouTube-8M可鏈接到700萬個帶標簽的視頻,ImageNet是這類早期數(shù)據(jù)庫之一,擁有超過1400萬個分類圖像。培訓數(shù)據(jù)集的規(guī)模繼續(xù)增長,F(xiàn)acebook最近宣布已經(jīng)編輯了35億張在Instagram上公開發(fā)布的圖片,并使用每張圖片的標簽作為標簽。在ImageNet的基準測試中,使用10億張這些照片來訓練圖像識別系統(tǒng)的記錄準確率達到了85.4%。
標記訓練中使用的數(shù)據(jù)集的繁瑣過程通常使用群集服務進行,例如亞馬遜機械土耳其人,它提供了遍布全球的大量低成本勞動力的訪問。例如,ImageNet由兩年近5萬人組成,主要通過Amazon Mechanical Turk招募。然而,F(xiàn)acebook使用公開可用的數(shù)據(jù)來訓練系統(tǒng)的方法可以提供另一種使用數(shù)十億個數(shù)據(jù)集的訓練系統(tǒng)的方法,而無需手動標記的開銷。
什么是無監(jiān)督學習?
相比之下,無監(jiān)督學習任務算法在數(shù)據(jù)中識別模式,試圖將相似性的數(shù)據(jù)進行分類。例如愛彼迎將鄰居可租用的房屋聚集在一起,或Google新聞每天將類似主題的故事分組在一起。
該算法不是為了挑選特定類型的數(shù)據(jù)而設計,它只是查找可以按照其相似性進行分組的數(shù)據(jù),或?qū)ふ彝怀霎惓5臄?shù)據(jù)。
什么是深度學習和深層神經(jīng)網(wǎng)絡?
機器學習的一個子集是深度學習,其中神經(jīng)網(wǎng)絡被擴展到具有大量數(shù)據(jù)訓練龐大網(wǎng)絡中。正是這些深度神經(jīng)網(wǎng)絡推動了計算機執(zhí)行語音識別和計算機視覺方面能力的飛躍發(fā)展。
各種類型的神經(jīng)網(wǎng)絡,有不同的優(yōu)勢和劣勢。遞歸神經(jīng)網(wǎng)絡是特別適用于語言處理和語音識別的一類神經(jīng)網(wǎng)絡,而卷積神經(jīng)網(wǎng)絡更常用于圖像識別。神經(jīng)網(wǎng)絡的設計也在不斷發(fā)展,研究人員最近為有效類型的深度神經(jīng)網(wǎng)絡設計了一種更高效的設計,稱為長期短期記憶或LSTM,使其能夠快速運行,例如Google翻譯。
進化算法的AI技術甚至被用于優(yōu)化神經(jīng)網(wǎng)絡。該方法最近由優(yōu)步人工智能實驗室展示,該實驗室發(fā)布了關于使用遺傳算法訓練深度神經(jīng)網(wǎng)絡以強化學習問題的論文。
機器學習用來干什么?
機器學習系統(tǒng)一直在我們身邊使用,是現(xiàn)代互聯(lián)網(wǎng)的基石。用于為您推薦在亞馬遜上想要購買的產(chǎn)品或想要在Netflix上觀看的視頻。
每個Google搜索都使用多個機器學習系統(tǒng),通過個性化搜索結(jié)果來了解查詢中的語言,因此搜索“低音”的釣魚愛好者不會被吉他的結(jié)果所淹沒。同樣,Gmail的垃圾郵件和網(wǎng)絡釣魚識別系統(tǒng)也使用經(jīng)過機器學習的訓練模型,讓您的收件箱避開流氓信息。
虛擬助手如蘋果的Siri,亞馬遜的Alexa,谷歌助理和微軟Cortana是機器學習最典型的例子。
除此之外,在許多其它行業(yè)中也有許多用處,包括:無人駕駛汽車,無人駕駛飛機的計算機視覺;聊天機器人和服務機器人的語音識別;人臉識別;幫助放射科醫(yī)生在X射線中挑選腫瘤,幫助研究人員發(fā)現(xiàn)與疾病相關的基因序列,并找出可能導致醫(yī)療保健中更有效藥物的分子;通過分析物聯(lián)網(wǎng)傳感器數(shù)據(jù),允許對基礎設施進行預測性維護等等。
本文由自興動腦人工智能學員:柯斌斌提供
借助此文,接下來我們會一步步講到深度學習,本文做為一個跳板。
-
AI
+關注
關注
88文章
34457瀏覽量
275865 -
人工智能
+關注
關注
1804文章
48798瀏覽量
247107 -
機器學習
+關注
關注
66文章
8495瀏覽量
134181 -
深度學習
+關注
關注
73文章
5557瀏覽量
122543
發(fā)布評論請先 登錄
一文讀懂人工智能、機器學習、神經(jīng)網(wǎng)絡及深度學習關系

詳解深度學習、神經(jīng)網(wǎng)絡與卷積神經(jīng)網(wǎng)絡的應用

評論