当条件为TRUE时,variamp(R方程序包)出错



我正在尝试计算使用party包中的cforest函数构建的随机林的变量重要性。我想运行条件设置为TRUE的varimp,但当我这样做时,我收到了一条错误消息

如果(node[[5]][1]==variableID)cp<-节点[[5]][[3]]:自变量长度为零

使用默认设置conditional = FALSE的Varimp运行效果良好。

关于数据集,所有变量都是分类的。反应变量是声门(是/否),有七个预测因素。这是一个数据链接,这是我正在使用的代码:

library(party)
glottal.df <-read.csv("~glottal_data.csv", header=T)
glottal.df$Instance <- factor(glottal.df$Instance)
data.controls <- cforest_unbiased(ntree = 500, mtry = 2)
set.seed(45)
glottal.cf <- cforest(Glottal ~ Stress + Boundary + Context + Instance + Region + Target + Speaker, data = glottal.df, controls = data.controls)
# this gives me an error
glottal.cf.varimp.true <- varimp(glottal.cf, conditional = TRUE)
# this works
glottal.cf.varimp.false <- varimp(glottal.cf)

有人能告诉我为什么会出现这个错误吗?任何特定变量都不是问题,因为即使我删除了一个变量,创建了一个新的林并尝试重新计算varimp,问题仍然存在,而且数据集中没有丢失的值。非常感谢您的帮助!

似乎正在与第1.2.4:方合作


> glottal.cf.varimp.true
       Stress      Boundary       Context
 0.0003412322  0.2405971564  0.0122369668
     Instance        Region        Target
-0.0043507109  0.0044360190 -0.0011469194
      Speaker
 0.0384834123
> packageVersion('party')
[1] ‘1.2.4’
> R.version
               _
platform       x86_64-pc-linux-gnu
arch           x86_64
os             linux-gnu
system         x86_64, linux-gnu
status
major          3
minor          4.3
year           2017
month          11
day            30
svn rev        73796
language       R
version.string R version 3.4.3 (2017-11-30)
nickname       Kite-Eating Tree

最新更新