Z1,所以綠色的超平面比較好" />

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深入地解析機器學習常用算法

8g3K_AI_Thinker ? 來源:未知 ? 作者:李倩 ? 2018-07-20 16:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫這篇文章的目的,是對ML的常用算法有個常識性的認識,沒有代碼,沒有復雜的理論推導,就是圖解一下,知道這些算法是什么,它們是怎么應用的,例子主要是分類問題。

每個算法都找了好幾個視頻,挑出講的最清晰明了有趣的,便于科普。以后有時間再對單個算法做深入地解析。

今天的算法解析如下:

決策樹

隨機森林算法

邏輯回歸

SVM

樸素貝葉斯

K最近鄰算法

K均值算法

Adaboost 算法

神經網絡

馬爾可夫

▌1. 決策樹

根據一些 feature 進行分類,每個節點提一個問題,通過判斷,將數據分為兩類,再繼續提問。這些問題是根據已有數據學習出來的,再投入新數據的時候,就可以根據這棵樹上的問題,將數據劃分到合適的葉子上。

▌2. 隨機森林

視頻:

https://www.youtube.com/watch?v=loNcrMjYh64

在源數據中隨機選取數據,組成幾個子集

S 矩陣是源數據,有 1-N 條數據,A B C 是feature,最后一列C是類別

由 S 隨機生成 M 個子矩陣

這 M 個子集得到 M 個決策樹

將新數據投入到這 M 個樹中,得到 M 個分類結果,計數看預測成哪一類的數目最多,就將此類別作為最后的預測結果

▌3. 邏輯回歸

視頻:

https://www.youtube.com/watch?v=gNhogKJ_q7U

當預測目標是概率這樣的,值域需要滿足大于等于0,小于等于1的,這個時候單純的線性模型是做不到的,因為在定義域不在某個范圍之內時,值域也超出了規定區間。

所以此時需要這樣的形狀的模型會比較好

那么怎么得到這樣的模型呢?

這個模型需要滿足兩個條件 大于等于0,小于等于1

大于等于0 的模型可以選擇 絕對值,平方值,這里用 指數函數,一定大于0小于等于1 用除法,分子是自己,分母是自身加上1,那一定是小于1的了。

再做一下變形,就得到了 logistic regression 模型

通過源數據計算可以得到相應的系數了

最后得到 logistic 的圖形

▌4. SVM(support vector machine)

視頻:

https://www.youtube.com/watch?v=1NxnPkZM9bc

要將兩類分開,想要得到一個超平面,最優的超平面是到兩類的 margin 達到最大,margin就是超平面與離它最近一點的距離,如下圖,Z2>Z1,所以綠色的超平面比較好

將這個超平面表示成一個線性方程

點到面的距離根據圖中的公式計算

所以得到 total margin 的表達式如下,目標是最大化這個 margin,就需要最小化分母

于是變成了一個優化問題:

舉個栗子,三個點,找到最優的超平面,定義了 weight vector=(2,3)-(1,1)

得到 weight vector 為(a,2a),將兩個點代入方程,代入(2,3)另其值=1,代入(1,1)另其值=-1,求解出 a 和 截矩 w0 的值,進而得到超平面的表達式。

a 求出來后,代入(a,2a)得到的就是 support vector

a 和 w0 代入超平面的方程就是 support vector machine

▌5. 樸素貝葉斯

視頻:

https://www.youtube.com/watch?v=TpjPzKODuXo

舉個在 NLP 的應用

給一段文字,返回情感分類,這段文字的態度是positive,還是negative

為了解決這個問題,可以只看其中的一些單詞

這段文字,將僅由一些單詞和它們的計數代表

原始問題是:給你一句話,它屬于哪一類通過 bayes rules 變成一個比較簡單容易求得的問題

問題變成,這一類中這句話出現的概率是多少,當然,別忘了公式里的另外兩個概率

栗子:單詞 love 在 positive 的情況下出現的概率是 0.1,在 negative 的情況下出現的概率是 0.001

▌6. K最近鄰(k nearest neighbours)

視頻:

https://www.youtube.com/watch?v=zHbxbb2ye3E

給一個新的數據時,離它最近的 k 個點中,哪個類別多,這個數據就屬于哪一類。

栗子:要區分 貓 和 狗,通過 claws 和 sound 兩個feature來判斷的話,圓形和三角形是已知分類的了,那么這個 star 代表的是哪一類呢

k=3時,這三條線鏈接的點就是最近的三個點,那么圓形多一些,所以這個star就是屬于貓

▌7. K均值

視頻:

https://www.youtube.com/watch?v=zHbxbb2ye3E

想要將一組數據,分為三類,粉色數值大,黃色數值小

最開心先初始化,這里面選了最簡單的 3,2,1 作為各類的初始值

剩下的數據里,每個都與三個初始值計算距離,然后歸類到離它最近的初始值所在類別

分好類后,計算每一類的平均值,作為新一輪的中心

幾輪之后,分組不再變化了,就可以停止了

▌8. Adaboost

視頻:

https://www.youtube.com/watch?v=rz9dnmHmZsY

adaboost 是 bosting 的方法之一。bosting就是把若干個分類效果并不好的分類器綜合起來考慮,會得到一個效果比較好的分類器。

下圖,左右兩個決策樹,單個看是效果不怎么好的,但是把同樣的數據投入進去,把兩個結果加起來考慮,就會增加可信度

adaboost 的栗子,手寫識別中,在畫板上可以抓取到很多 features,例如 始點的方向,始點和終點的距離等等

training 的時候,會得到每個 feature 的 weight,例如 2 和 3 的開頭部分很像,這個 feature 對分類起到的作用很小,它的權重也就會較小

而這個 alpha 角就具有很強的識別性,這個 feature 的權重就會較大,最后的預測結果是綜合考慮這些 feature 的結果

▌9. 神經網絡

視頻:

https://www.youtube.com/watch?v=CEv_0r5huTY&list=PLjJh1vlSEYgvGod9wWiydumYl8hOXixNu&index=3

Neural Networks 適合一個input可能落入至少兩個類別里

NN 由若干層神經元,和它們之間的聯系組成,第一層是 input 層,最后一層是 output 層,在 hidden 層 和 output 層都有自己的 classifier

input 輸入到網絡中,被激活,計算的分數被傳遞到下一層,激活后面的神經層,最后output 層的節點上的分數代表屬于各類的分數,下圖例子得到分類結果為 class 1

同樣的 input 被傳輸到不同的節點上,之所以會得到不同的結果是因為各自節點有不同的weights 和 bias,這也就是 forward propagation

▌10. 馬爾可夫

視頻:

https://www.youtube.com/watch?v=56mGTszb_iM

Markov Chains 由 state 和 transitions 組成

栗子,根據這一句話 ‘the quick brown fox jumps over the lazy dog’,要得到 markov chain,步驟——先給每一個單詞設定成一個狀態,然后計算狀態間轉換的概率

這是一句話計算出來的概率,當你用大量文本去做統計的時候,會得到更大的狀態轉移矩陣,例如 the 后面可以連接的單詞,及相應的概率

生活中,鍵盤輸入法的備選結果也是一樣的原理,模型會更高級

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134394
  • 決策樹
    +關注

    關注

    3

    文章

    96

    瀏覽量

    13803

原文標題:輕松看懂機器學習常用算法

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習常用的決策樹算法技術解析

    決策樹是最重要的機器學習算法之一,其可被用于分類和回歸問題。本文中,我們將介紹分類部分。
    發表于 10-12 16:39 ?1493次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>中<b class='flag-5'>常用</b>的決策樹<b class='flag-5'>算法</b>技術<b class='flag-5'>解析</b>

    【阿里云大學免費精品課】機器學習入門:概念原理及常用算法

    摘要: 阿里云大學聯合螞蟻金服高級算法專家推出了免費的機器學習入門課程:機器學習入門:概念原理及常用
    發表于 06-23 13:51

    常用python機器學習庫盤點

    現在人工智能非常火爆,機器學習應該算是人工智能里面的一個子領域,而其中有一塊是對文本進行分析,對數據進行深入的挖掘提取一些特征值,然后用一些算法
    發表于 05-10 15:20

    一文解析機器學習常用35大算法

    本文將帶你遍歷機器學習領域最受歡迎的算法。系統地了解這些算法有助于進一步掌握機器學習。當然,本文
    的頭像 發表于 06-30 04:24 ?4099次閱讀
    一文<b class='flag-5'>解析</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>常用</b>35大<b class='flag-5'>算法</b>

    機器學習算法常用指標匯總

    機器學習性能評價標準是模型優化的前提,在設計機器學習算法過程中,不同的問題需要用到不同的評價標準,本文對
    的頭像 發表于 02-13 15:09 ?5486次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b><b class='flag-5'>常用</b>指標匯總

    10大常用機器學習算法匯總

    本文介紹了10大常用機器學習算法,包括線性回歸、Logistic回歸、線性判別分析、樸素貝葉斯、KNN、隨機森林等。
    發表于 11-20 11:10 ?2940次閱讀

    17個機器學習常用算法

    根據數據類型的不同,對一個問題的建模有不同的方式。在機器學習或者人工智能領域,人們首先會考慮算法學習方式。在機器
    的頭像 發表于 08-11 11:20 ?2043次閱讀

    17個機器學習常用算法

    源自:AI知識干貨 根據數據類型的不同,對一個問題的建模有不同的方式。在機器學習或者人工智能領域,人們首先會考慮算法學習方式。在機器
    的頭像 發表于 08-22 09:57 ?2544次閱讀
    17個<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的<b class='flag-5'>常用</b><b class='flag-5'>算法</b>!

    常用機器學習算法的基本概念和特點

    。因此對于數據科學家來說,理解算法顯得格外重要,理解不同算法的思想可以幫助數據科學家更從容地面對不同的應用場景。 本文列出了常用機器學習
    的頭像 發表于 01-17 15:43 ?4128次閱讀

    機器學習算法的5種基本算子

    自主決策的方法和插件,其中包含了一系列常用的基本算子。在本文中,我們將會介紹機器學習算法的五種基本算子。 一、 求值算子 求值算子是常用
    的頭像 發表于 08-17 16:11 ?2230次閱讀

    機器學習算法匯總 機器學習算法分類 機器學習算法模型

    是解決具體問題的一系列步驟,機器學習算法被設計用于從大量的數據中自動學習并不斷改進自身的性能。本文將為大家介紹機器
    的頭像 發表于 08-17 16:11 ?1516次閱讀

    機器學習算法總結 機器學習算法是什么 機器學習算法優缺點

    機器學習算法總結 機器學習算法是什么?機器
    的頭像 發表于 08-17 16:11 ?2441次閱讀

    機器學習算法入門 機器學習算法介紹 機器學習算法對比

    機器學習算法入門 機器學習算法介紹 機器
    的頭像 發表于 08-17 16:27 ?1239次閱讀

    機器學習有哪些算法機器學習分類算法有哪些?機器學習預判有哪些算法

    機器學習有哪些算法機器學習分類算法有哪些?機器
    的頭像 發表于 08-17 16:30 ?2382次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器
    的頭像 發表于 07-02 11:25 ?2273次閱讀