r语言 - 阐明决策树代理项拆分



我有一个关于 R 中 rpart 分类树输出的问题。如果缺少值,则使用代理项拆分。下面是一个示例。

  Surrogate splits:
  ##       bmi    < 21.51 to the right, agree=0.858, adj=0.632, (0 split)

协议是否计算为代理拆分与主要拆分一致的案例比例?例如,如果代理人未能就 4 个数据点中的 1 个达成一致,则协议将为 .75。这是对的吗?

此外,我不确定我对调整后的解释。这是偶然考虑协议的调整协议吗?如果是这样,这是如何计算的?我认为这一定与数据中的先验有关,但不确定。

任何见解都值得赞赏。提前谢谢你。

您对协议计算是正确的。 调整是节点杂质的减少。它参考了 rpart 的主要拆分。调整后越高,就越适合考虑代孕拆分。这就是我的理解。如果有人加入其中,那就太好了。

最新更新