在二元分类中查找特征的标准



我已经在 h2o 中使用 DRF 进行了二元分类。我已经了解了特征的重要性,然后我要求找到每个特征的标准。

例如:我必须对用户进行分类,哪些用户接受哪些,哪些拒绝,特征是年龄,薪水,work_experience,实时城市(当然已经解码(。所以,我的老板想知道哪个年龄段的用户倾向于被拒绝或接受,哪个范围的工资,哪些城市有被拒绝或接受的趋势。

我不会错,但我想要的输出可能如下所示:

Tendency salary for accepted user = 10k - 50k
Tendency salary for accepted user = 5k - 30k
Tendency age for accepted user = 18 - 55
Tendency age for rejected user = 31 - 35
Tendency cities for accepted user = 1, 5, 10, 23
Tendency cities for rejected user = 3, 4, 12, 36
so on..

如何实现?

p.s:我有一个接受的用户列表。

我认为你需要像部分依赖图这样的东西。 以下是 H2O 中的一个例子:https://rdrr.io/cran/h2o/man/h2o.partialPlot.html

PDP 将显示目标概率如何取决于某个变量的值。

最新更新