递归特征消除(对所有特征具有相似的重要性)



我正试图使用10个分类变量(都是相同的1到10级(来拟合一个分类变量的模型(3个级别=低、中、高(。我用随机森林运行递归特征消除(RFE(,结果是所有变量都具有相似的重要性(每个变量约10%(。我本以为会有一个主导变量,但事实并非如此。这怎么解释呢?我应该尝试不同的建模方式,还是这只是数据的本质?

PS:我运行了一个corr矩阵,所有10个特征与目标变量的相关性都很低。如果是这样的话,在相关性水平较低的情况下,我是否应该期待没有变量主导重要性?

从技术上讲,是的,所有属性都有可能具有同等的影响力。这种平等是否有意义只能用"平等"来回答;真知灼见"关于特定数据集或域。

最新更新