R语言 二叉决策树 (CART) 的拆分和根节点



如何在回归树中找到拆分和根节点,我从多个向量制作了一个回归树,现在我必须提取多个向量的rpart的根节点.file包含多个向量的数值ABCDEFGHex。向量包含 4,3,6,7,2,4,5,...等等类似地,其他B,C,D,E,F,G,H .所以想提取F(在我的情况下是根节点)作为此输入的输出,并在创建树后.谢谢.抱歉无法放置任何图像:(

这是我到目前为止所做的

log_data <- read.csv(file="C:\Users\AASHU\Desktop\CART\syn.csv",
header=T, as.is=T)
library(rpart)
fit <- rpart(A ~ B+C+D+E+F+G+H, log_data)
# plot(fit)
plot(fit, compress=TRUE, branch=0)
text(fit, xpd = NA, cex = 0.7)
summary(fit)
Call:
rpart(formula = A ~ B + C + D + E + F + G + H, data = log_data)
n=52 (1 observation deleted due to missingness)
CP nsplit rel error   xerror      xstd
1 0.09798662      0 1.0000000 1.065250 0.1888568
2 0.09347624      1 0.9020134 1.198999 0.1842667
3 0.03632980      2 0.8085371 1.154558 0.1859743
4 0.02297130      3 0.7722073 1.254874 0.2029423
5 0.01000000      4 0.7492360 1.274024 0.2118272
Node number 1: 52 observations,    complexity param=0.09798662
mean=4.403846, MSE=1.509985 
left son=2 (7 obs) right son=3 (45 obs)
Primary splits:
F < 5.5 to the right, improve=0.09798662, (0 missing)

..... 现在我必须从 fit(回归树)及其拆分中提取根节点F(F>=5.5),有人可以帮助我吗?

找到该树的标签,以便我们可以提取任何向量

当根节点为字符时(例如-A)

nodes<-labels(fit, digits=4, minlength=1L, pretty, collapse=TRUE)
root<-substr(nodes[2], 1, 1)

路径中我们可以提取树的根节点,下面是一个最好通过其第二次拆分来提取根节点名称,该拆分只不过是一个根节点。

nodes<-labels(fit, digits=4, minlength=1L, pretty, collapse=TRUE)
path<-path.rpart(fit, node_no, pretty=0, print.it=FALSE) 
path[[2]][1]

最新更新