剛開始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),筆者經(jīng)常面臨這樣一個(gè)問題:遇到具體問題,選擇何種算法才合適。也許你也和我一樣,搜了很多有關(guān)機(jī)器學(xué)習(xí)算法的文章,會(huì)看到許多詳細(xì)的描述,卻并沒有減少讓抉擇的難度。
言歸正傳,筆者建議你好好了解幾個(gè)監(jiān)督和無監(jiān)督機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn)方式和數(shù)學(xué)直覺思維,如:
線性回歸
邏輯回歸
決策樹
樸素貝葉斯
支持向量機(jī)
隨機(jī)森林
自適應(yīng)提升(AdaBoost)
梯度提升樹(GBT)
簡單神經(jīng)網(wǎng)絡(luò)
層次聚類
高斯混合模型
循環(huán)神經(jīng)網(wǎng)絡(luò)
推薦系統(tǒng)
在對(duì)機(jī)器學(xué)習(xí)任務(wù)的類型有一些了解之后,就可以根據(jù)問題陳述來探索現(xiàn)實(shí)生活中最流行的算法及其應(yīng)用。讀完本文之后,就試著解決這些問題吧!相信你一定獲益匪淺。
問題陳述1:預(yù)測(cè)房價(jià)走勢(shì)。
解決該問題的機(jī)器學(xué)習(xí)算法:諸如隨機(jī)森林和梯度提升之類的高級(jí)回歸算法。
問題陳述2:深挖客戶統(tǒng)計(jì)數(shù)據(jù)用以識(shí)別模式。
解決該問題的機(jī)器學(xué)習(xí)算法:聚類算法(肘部法則)。
問題陳述3:預(yù)測(cè)貸款還款情況。
解決該問題的機(jī)器學(xué)習(xí)算法:不平衡數(shù)據(jù)集分類算法。
問題陳述4:根據(jù)皮膚病變的特征(大小、形狀、顏色等)判斷病變?yōu)榱夹赃€是惡性。
解決該問題的機(jī)器學(xué)習(xí)算法:卷積神經(jīng)網(wǎng)絡(luò)(U-Net網(wǎng)絡(luò)是用于分割的不二之選)。
問題陳述5:預(yù)測(cè)客戶流失。
解決該問題的機(jī)器學(xué)習(xí)算法:線性判別分析(LDA)或二次判別分析(QDA)。LDA特別受歡迎,因?yàn)樗仁欠诸惼饔质墙稻S技術(shù)。
問題陳述6:為員工招聘提供決策框架。
解決該問題的機(jī)器學(xué)習(xí)算法:在這方面,決策樹堪稱“職業(yè)玩家”。
問題陳述7:了解并預(yù)測(cè)產(chǎn)品的熱銷屬性。
解決該問題的機(jī)器學(xué)習(xí)算法:邏輯回歸或決策樹。
問題陳述8:分析市場情緒,評(píng)估市場對(duì)產(chǎn)品的認(rèn)知。
解決該問題的機(jī)器學(xué)習(xí)算法:樸素貝葉斯-支持向量機(jī)(NBSVM算法)。
問題陳述9:創(chuàng)建分類系統(tǒng),過濾垃圾郵件。
解決該問題的機(jī)器學(xué)習(xí)算法:分類算法。建議使用樸素貝葉斯、支持向量機(jī)、多層感知器神經(jīng)網(wǎng)絡(luò)(MLPNNs)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)算法。
問題陳述10:預(yù)測(cè)用戶點(diǎn)擊在線廣告的可能性。
解決該問題的機(jī)器學(xué)習(xí)算法:邏輯回歸或支持向量機(jī)。
問題陳述11:檢測(cè)信用卡交易中的欺詐行為。
解決該問題的機(jī)器學(xué)習(xí)算法:自適應(yīng)提升、孤立森林或隨機(jī)森林。
問題陳述12:根據(jù)車輛特性預(yù)估車輛價(jià)格。
解決該問題的機(jī)器學(xué)習(xí)算法:梯度提升是解決此問題的最佳選擇。
問題陳述13:預(yù)測(cè)病人加入醫(yī)保的概率。
解決該問題的機(jī)器學(xué)習(xí)算法:簡單神經(jīng)網(wǎng)絡(luò)。
問題陳述14:預(yù)測(cè)已注冊(cè)用戶是否愿意為某一產(chǎn)品支付一定金額。
解決該問題的機(jī)器學(xué)習(xí)算法:神經(jīng)網(wǎng)絡(luò)。
問題陳述15:根據(jù)顧客的不同特征(如年齡)進(jìn)行分類。
解決該問題的機(jī)器學(xué)習(xí)算法:K均值聚類算法。
問題陳述16:從語音數(shù)據(jù)中提取特征用于語音識(shí)別系統(tǒng)。
解決該問題的機(jī)器學(xué)習(xí)算法:高斯混合模型。
問題陳述17:多目標(biāo)跟蹤,用混合成分?jǐn)?shù)目及均值預(yù)測(cè)目標(biāo)在視頻序列中每幀的位置。
解決該問題的機(jī)器學(xué)習(xí)算法:高斯混合模型。
問題陳述18:排列一組微陣列實(shí)驗(yàn)中的基因和樣本,揭示生物學(xué)上有趣的模式。
解決該問題的機(jī)器學(xué)習(xí)算法:層次聚類算法。
問題陳述19:根據(jù)特征相似的其他用戶的偏好,向用戶推薦電影。
解決該問題的機(jī)器學(xué)習(xí)算法:推薦系統(tǒng)。
問題陳述20:根據(jù)用戶閱讀的文章,向用戶推薦他們想讀的新聞文章。
解決該問題的機(jī)器學(xué)習(xí)算法:推薦系統(tǒng)。
問題陳述21:優(yōu)化自動(dòng)駕駛汽車的駕駛行為。
解決該問題的機(jī)器學(xué)習(xí)算法:強(qiáng)化學(xué)習(xí)。
問題陳述22:通過醫(yī)學(xué)掃描診斷健康疾病。
解決該問題的機(jī)器學(xué)習(xí)算法:卷積神經(jīng)網(wǎng)絡(luò)。
問題陳述23:平衡不同需求周期下的電網(wǎng)負(fù)荷。
解決該問題的機(jī)器學(xué)習(xí)算法:強(qiáng)化學(xué)習(xí)。
問題陳述24:處理時(shí)間序列數(shù)據(jù)或序列(如音頻記錄或文本)。
解決該問題的機(jī)器學(xué)習(xí)算法:循環(huán)神經(jīng)網(wǎng)絡(luò)或長短期記憶網(wǎng)絡(luò)(LSTM)。
問題陳述25:翻譯語言。
解決該問題的機(jī)器學(xué)習(xí)算法:循環(huán)神經(jīng)網(wǎng)絡(luò)。
問題陳述26:為圖像生成標(biāo)題。
解決該問題的機(jī)器學(xué)習(xí)算法:循環(huán)神經(jīng)網(wǎng)絡(luò)。
問題陳述27:訓(xùn)練聊天機(jī)器人,處理客戶更細(xì)微的需求和問詢。
解決該問題的機(jī)器學(xué)習(xí)算法:循環(huán)神經(jīng)網(wǎng)絡(luò)。
希望本文的介紹能讓你對(duì)最常用的機(jī)器學(xué)習(xí)算法有所了解,當(dāng)遇到特定問題時(shí),能夠快速反應(yīng),選擇合適的機(jī)器學(xué)習(xí)算法。
責(zé)編AJX
-
算法
+關(guān)注
關(guān)注
23文章
4699瀏覽量
94748 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8492瀏覽量
134094
發(fā)布評(píng)論請(qǐng)先 登錄
**【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**
機(jī)器學(xué)習(xí)的算法應(yīng)用
【專輯精選】機(jī)器學(xué)習(xí)之算法教程與資料
干貨 | 這些機(jī)器學(xué)習(xí)算法,你了解幾個(gè)?
什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門
Spark機(jī)器學(xué)習(xí)庫的各種機(jī)器學(xué)習(xí)算法
R語言機(jī)器學(xué)習(xí)算法的性能分析比較
17個(gè)機(jī)器學(xué)習(xí)的常用算法!

評(píng)論