获取随机森林回归器训练期间使用的特征列表



我使用一组数据来学习随机森林回归器,现在我有另一个数据集,其特征数量较少(前一组的子集(。

是否有一个函数可以获取在随机森林回归器模型训练期间使用的列的名称列表? 如果没有,那么是否有一个函数可以为缺少的列分配 Null?

是否有允许获取列名称列表的函数 在随机森林回归器模型的训练期间使用?

RF 使用数据集中的所有要素。每棵树可能包含sqrt(num_of_features(或log2(num_of_features(或其他任何内容,但这些列是随机选择的。因此,通常 RF 会覆盖数据集中的所有列。

当您在 RF 中使用少量估计器时,可能会出现边缘情况,并且可能无法考虑某些功能。我想,RandomForestRegressor.feature_importances_(零或nan值可能是这里的指标(或潜入RandomForestRegressor.estimators_的每一棵树可能会有所帮助。

如果没有,那么是否有一个函数可以用于缺少的列 分配空值?

RF 不接受缺失值。您需要将缺失值编码为单独的类(并用于学习(,或者XGBoost(例如(是您的选择。

最新更新