女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡要解釋one hot編碼這一機器學(xué)習(xí)中極為常見的技術(shù)

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-06-30 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:數(shù)據(jù)科學(xué)家Rakshith Vasudev簡要解釋了one hot編碼這一機器學(xué)習(xí)中極為常見的技術(shù)。

圖片來源:imgur

你可能在有關(guān)機器學(xué)習(xí)的很多文檔、文章、論文中接觸到“one hot編碼”這一術(shù)語。本文將科普這一概念,介紹one hot編碼到底是什么。

一句話概括:one hot編碼是將類別變量轉(zhuǎn)換為機器學(xué)習(xí)算法易于利用的一種形式的過程。

通過例子可能更容易理解這個概念。

假設(shè)我們有一個迷你數(shù)據(jù)集:

其中,類別值是分配給數(shù)據(jù)集中條目的數(shù)值編號。比如,如果我們在數(shù)據(jù)集中新加入一個公司,那么我們會給這家公司一個新類別值4。當(dāng)獨特的條目增加時,類別值將成比例增加。

在上面的表格中,類別值從1開始,更符合日常生活中的習(xí)慣。實際項目中,類別值從0開始(因為大多數(shù)計算機系統(tǒng)計數(shù)),所以,如果有N個類別,類別值為0至N-1.

sklear的LabelEncoder可以幫我們完成這一類別值分配工作。

現(xiàn)在讓我們繼續(xù)討論one hot編碼,將以上數(shù)據(jù)集one hot編碼后,我們得到的表示如下:

在我們繼續(xù)之前,你可以想一下為什么不直接提供標(biāo)簽編碼給模型訓(xùn)練就夠了?為什么需要one hot編碼?

標(biāo)簽編碼的問題是它假定類別值越高,該類別更好?!暗鹊龋裁?!”

讓我解釋一下:根據(jù)標(biāo)簽編碼的類別值,我們的迷你數(shù)據(jù)集中VW > Acura > Honda。比方說,假設(shè)模型內(nèi)部計算平均值(神經(jīng)網(wǎng)絡(luò)中有大量加權(quán)平均運算),那么1 + 3 = 4,4 / 2 = 2. 這意味著:VW和Honda平均一下是Acura。毫無疑問,這是一個糟糕的方案。該模型的預(yù)測會有大量誤差。

我們使用one hot編碼器對類別進行“二進制化”操作,然后將其作為模型訓(xùn)練的特征,原因正在于此。

當(dāng)然,如果我們在設(shè)計網(wǎng)絡(luò)的時候考慮到這點,對標(biāo)簽編碼的類別值進行特別處理,那就沒問題。不過,在大多數(shù)情況下,使用one hot編碼是一個更簡單直接的方案。

另外,如果原本的標(biāo)簽編碼是有序的,那one hot編碼就不合適了——會丟失順序信息。

最后,我們用一個例子總結(jié)下本文:

假設(shè)“花”的特征可能的取值為daffodil(水仙)、lily(百合)、rose(玫瑰)。one hot編碼將其轉(zhuǎn)換為三個特征:is_daffodil、is_lily、is_rose,這些特征都是二進制的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3787

    瀏覽量

    137678
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134394
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25377

原文標(biāo)題:什么是one hot編碼?為什么要使用one hot編碼?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學(xué)習(xí)模型可解釋性的結(jié)果分析

    模型的可解釋性是機器學(xué)習(xí)領(lǐng)域的個重要分支,隨著 AI 應(yīng)用范圍的不斷擴大,人們越來越不滿足于模型的黑盒特性,與此同時,金融、自動駕駛等領(lǐng)域的法律法規(guī)也對模型的可
    發(fā)表于 09-28 10:17 ?1386次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>模型可<b class='flag-5'>解釋</b>性的結(jié)果分析

    如何通過XGBoost解釋機器學(xué)習(xí)

    本文為大家介紹用XGBoost解釋機器學(xué)習(xí)。 這是個故事,關(guān)于錯誤地解釋機器
    發(fā)表于 10-12 11:48 ?2036次閱讀
    如何通過XGBoost<b class='flag-5'>解釋</b><b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>

    基于深度學(xué)習(xí)技術(shù)的智能機器

    ——工業(yè)機器人的智能化程度要求也越來越高,采用深度學(xué)習(xí)技術(shù)為工業(yè)機器人賦能是目前各大廠商的統(tǒng)認(rèn)知。本文結(jié)合實際案例,
    發(fā)表于 05-31 09:36

    解釋機器學(xué)習(xí)——打開機器學(xué)習(xí)黑匣子

    【資源下載】《可解釋機器學(xué)習(xí)》,打開機器學(xué)習(xí)黑匣子
    發(fā)表于 05-20 14:16

    機器學(xué)習(xí)的相關(guān)資料下載

    應(yīng)用與其他更簡單的機器學(xué)習(xí)應(yīng)用的區(qū)別在于它們采用二維輸入格式。在眾多機器學(xué)習(xí)應(yīng)用中極為常用的神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò) (DNN)。這類神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-14 07:03

    HOT-51-學(xué)習(xí)板的原理圖

    HOT-51,學(xué)習(xí)板的原理圖
    發(fā)表于 02-07 21:06 ?6次下載

    詳談機器學(xué)習(xí)的決策樹模型

    決策樹模型是白盒模型的種,其預(yù)測結(jié)果可以由人來解釋。我們把機器學(xué)習(xí)模型的這一特性稱為可解釋性,
    的頭像 發(fā)表于 07-06 09:49 ?3901次閱讀
    詳談<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>的決策樹模型

    人工智能和機器學(xué)習(xí)技術(shù)如何解釋數(shù)據(jù)?

    當(dāng)今的業(yè)務(wù)由數(shù)據(jù)和數(shù)據(jù)驅(qū)動的理解所支配。您如何理解數(shù)據(jù)以及如何將數(shù)據(jù)解釋為業(yè)務(wù)決策直接影響您的業(yè)務(wù)轉(zhuǎn)換和增長。為了更精確地理解數(shù)據(jù),如今我們擁有人工智能(AI)和機器學(xué)習(xí)(ML)技術(shù)
    的頭像 發(fā)表于 09-04 12:01 ?2722次閱讀

    關(guān)于機器學(xué)習(xí)模型的六大可解釋技術(shù)

    本文介紹目前常見的幾種可以提高機器學(xué)習(xí)模型的可解釋性的技術(shù)。
    的頭像 發(fā)表于 02-26 17:20 ?2499次閱讀
    關(guān)于<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>模型的六大可<b class='flag-5'>解釋</b>性<b class='flag-5'>技術(shù)</b>

    機器學(xué)習(xí)模型的可解釋性算法詳解

    本文介紹目前常見的幾種可以提高機器學(xué)習(xí)模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。
    的頭像 發(fā)表于 02-16 16:21 ?5268次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>模型的可<b class='flag-5'>解釋</b>性算法詳解

    解釋機器學(xué)習(xí)

    解釋機器學(xué)習(xí)
    發(fā)表于 06-17 14:41 ?1次下載

    可以提高機器學(xué)習(xí)模型的可解釋技術(shù)

    本文介紹目前常見的幾種可以提高機器學(xué)習(xí)模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。
    的頭像 發(fā)表于 02-08 14:08 ?1634次閱讀

    編碼器在伺服的作用與常見伺服編碼

    伺服編碼器是工業(yè)機器技術(shù)核心伺服電機的必配,對于伺服電機性能乃至機器人性能的作用極為關(guān)鍵。
    的頭像 發(fā)表于 05-25 11:35 ?4721次閱讀
    <b class='flag-5'>編碼</b>器在伺服的作用與<b class='flag-5'>常見</b>伺服<b class='flag-5'>編碼</b>器

    什么是特征工程?機器學(xué)習(xí)的特征工程詳解解讀

    One-hot 編碼對于用機器學(xué)習(xí)模型能夠理解的簡單數(shù)字?jǐn)?shù)據(jù)替換分類數(shù)據(jù)很有用。
    發(fā)表于 12-28 17:14 ?541次閱讀
    什么是特征工程?<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>的特征工程詳解解讀

    常見xgboost錯誤及解決方案

    XGBoost(eXtreme Gradient Boosting)是種流行的機器學(xué)習(xí)算法,用于解決分類和回歸問題。盡管它非常強大和靈活,但在使用過程中可能會遇到
    的頭像 發(fā)表于 01-19 11:22 ?2432次閱讀