随机森林中重要特征的统计显著性



我有一个随机森林分类器,它给了我一个特征重要性等级。

我怎样才能得出重要特征的统计显著性,类似于回归模型,在回归模型中,你们可以推断贝塔系数的统计学显著性?

你的问题有点过于宽泛和不清楚。

feature_importance_视为百分比的一种简单方法是对其值进行归一化

importance_sum = sum(clf. feature_importances_)
feature_importance_as_percent =  [100*(x/sum) for x in clf.feature_importances_]

其他方法包括参数或非参数测试。

另请阅读:如何确定RandomForestClassifier中的feature_importments?

最新更新