R - partykit:回归识别终端节点箱线图中的异常值



使用以下代码创建的回归树具有所有终端节点的箱线图。箱线图显示了中位数、IQR 和异常值,这很棒。

plot(as.party(tree), terminal_panel = node_boxplot)

但是如何识别箱线图中的异常值呢?我认为,由于箱线图已经创建,因此提取异常值应该相对容易,但信息似乎没有存储在树中。我知道我可以按照树的路径来识别数据集中的异常值,但想知道是否有更快的方法来做到这一点。

由于您不提供数据,我将使用内置的cars数据执行此操作。
你是对的,这些信息似乎没有存储在树中。 此外,该情节没有提供有意义的回报。至少一种方法是使用boxplot重做箱线图,您可以获得异常值。

library(rpart)
library(partykit)
CarTree = rpart(dist ~ ., data=cars)
PCT = as.party(CarTree)
P = plot(PCT, terminal_panel = node_boxplot)
BP = boxplot(cars$dist ~ PCT[1]$fitted[[1]])
BP$out
[1] 80

最新更新