欧美丰满大乳大屁股流白浆,欧美va亚洲va国产综合,十九禁止观看A片无码

決策樹模型是白盒模型的一種，其預測結果可以由人來解釋。我們把機器學習模型的這一特性稱為可解釋性，但并不是所有的機器學習模型都具有可解釋性。

作為可解釋性屬性的一部分，特征重要性是一個衡量每個輸入特征對模型預測結果貢獻的指標，即某個特征上的微小變化如何改變預測結果。

直覺

不同于基尼不純度或熵，沒有一個通用的數學公式來定義特征的重要性，而特征的重要性在不同的模型中是不同的。

例如，對于線性回歸模型，假設所有輸入特征具有相同的尺度（如［0，1］，那么每個特征的特征重要性就是與該特征相關的權值的絕對值。從這個公式可以看出線性回歸模型的f （X） =∑i = 1 n （wixi），模型的結果是線性正比于每個組件（wixi）這是由重量決定的（wi）的組件。

對于決策樹，為了度量特征的重要性，我們需要研究模型，看看每個特征是如何在模型的最終“決策”中發揮作用的。從前面的文章中我們了解到，在決策樹模型中，在每個決策節點上，我們選擇最佳的特征進行分割，以便進一步區分到達該決策節點的樣本。在每一次分割中，我們都更接近最終的決定（即葉節點）。因此，我們可以說，在每個決策節點上，所選擇的分割特征決定了最終的預測結果。直觀地說，我們也可以說，那些被選擇的特征比那些實際上在決策過程中沒有作用的非被選擇的特征更重要。現在，剩下的問題是我們如何量化地衡量這種重要性。

有人可能還記得，我們使用信息增益或基尼系數來衡量分割的質量。當然，還可以將增益與所選擇的特性關聯起來，并使用增益來量化該特性在這個特定的分裂發生時的貢獻。此外，我們可以累積決策樹中出現的每個特征的增益。

最后，每個特征的累積增益可以作為決策樹模型的特征重要性。

另一方面，作為一個可能會注意到，這一決定節點不是同樣重要的是，自從決定節點樹的根可以幫助過濾所有的輸入樣本，而決定節點樹的底部有助于區分總樣本的只有少數。因此，一個特征在每個決策節點獲得的增益的權重并不相同，即一個特征在一個決策節點獲得的增益應按該決策節點幫助區分的樣本比例進行加權。

基于上述直覺，我們可以推導出以下公式來計算決策樹中每個特征的重要性I：

詳談機器學習的決策樹模型