我有兴趣了解随机森林是如何计算概率估计的,无论是在一般情况下还是在Python的scikit-learn库中(其中概率估计由predict_proba函数返回)。
谢谢,家伙
森林返回的概率是集合(文档)中树返回的平均概率。单个树返回的概率是样本所在叶子的归一化类直方图。
除了Andreas/Dougal所说的,当你训练RF时,打开compute_importances=True。然后检查classifier.feature_importances_
,看看哪些特征发生在RF树的高层。