值 Python 中二进制分类器的重要性



我正在Python 3.5中创建二元分类器

所以有特征的数量(x1。xn) 和目标值 y,就像这样:

x1        x2 x3  y
Monday    10 12  1
Tuesday   18 20  0
Monday    12 22  1
Wednesday 19 19  0
Thursday  10 11  1
Thursday  10 12  1
Friday    19 12  0 
Friday    18 21  0
Friday    12 10  1

因此,我做分类器(以及数据预处理、交叉验证和评估等所有必需的步骤)没有问题。

我的问题 - 如何估计 y 变量是否有任何显着变化,具体取决于星期几(周一至周五),第 x1 列?

我知道一些技术是特征的重要性,但使用它们我只能了解什么确切的特征(x1,x2 或 x3)对预测器最有价值。

如何理解目标变量列(x1,一周中的几天)内非重复值的重要性?

谢谢!

x1 列中的值可以转换为包含二进制逻辑值 ([0;1]) 的列。然后可以应用特征重要性技术。

http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html

相关内容

  • 没有找到相关文章

最新更新