我有一个随机森林分类器,它给了我一个特征重要性等级。
我怎样才能得出重要特征的统计显著性,类似于回归模型,在回归模型中,你们可以推断贝塔系数的统计学显著性?
你的问题有点过于宽泛和不清楚。
将feature_importance_
值视为百分比的一种简单方法是对其值进行归一化:
importance_sum = sum(clf. feature_importances_)
feature_importance_as_percent = [100*(x/sum) for x in clf.feature_importances_]
其他方法包括参数或非参数测试。
另请阅读:如何确定RandomForestClassifier中的feature_importments?