我正在尝试计算使用party
包中的cforest
函数构建的随机林的变量重要性。我想运行条件设置为TRUE
的varimp,但当我这样做时,我收到了一条错误消息
如果(node[[5]][1]==variableID)cp<-节点[[5]][[3]]:自变量长度为零
使用默认设置conditional = FALSE
的Varimp运行效果良好。
关于数据集,所有变量都是分类的。反应变量是声门(是/否),有七个预测因素。这是一个数据链接,这是我正在使用的代码:
library(party)
glottal.df <-read.csv("~glottal_data.csv", header=T)
glottal.df$Instance <- factor(glottal.df$Instance)
data.controls <- cforest_unbiased(ntree = 500, mtry = 2)
set.seed(45)
glottal.cf <- cforest(Glottal ~ Stress + Boundary + Context + Instance + Region + Target + Speaker, data = glottal.df, controls = data.controls)
# this gives me an error
glottal.cf.varimp.true <- varimp(glottal.cf, conditional = TRUE)
# this works
glottal.cf.varimp.false <- varimp(glottal.cf)
有人能告诉我为什么会出现这个错误吗?任何特定变量都不是问题,因为即使我删除了一个变量,创建了一个新的林并尝试重新计算varimp,问题仍然存在,而且数据集中没有丢失的值。非常感谢您的帮助!
似乎正在与第1.2.4:方合作
> glottal.cf.varimp.true
Stress Boundary Context
0.0003412322 0.2405971564 0.0122369668
Instance Region Target
-0.0043507109 0.0044360190 -0.0011469194
Speaker
0.0384834123
> packageVersion('party')
[1] ‘1.2.4’
> R.version
_
platform x86_64-pc-linux-gnu
arch x86_64
os linux-gnu
system x86_64, linux-gnu
status
major 3
minor 4.3
year 2017
month 11
day 30
svn rev 73796
language R
version.string R version 3.4.3 (2017-11-30)
nickname Kite-Eating Tree