我正在尝试分析一个重复出现的事件数据集,但我正在努力适应模型。
我的数据子集:
outdat <- structure(list(yr = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3), jday = c(141, 151, 156, 157, 157, 158, 164, 168, 168, 168, 168, 168, 168, 170, 171, 171, 177, 177, 177, 178, 179, 181, 182, 182, 182, 182, 182, 184, 186, 188, 188, 188, 189, 191, 197, 197, 197, 198, 198, 199, 209, 211, 217, 223, 230, 161, 187, 196, 196, 196, 197, 197, 201, 204, 204, 204, 208, 209, 211, 212, 215, 215, 219, 221, 222, 225, 229, 229, 245, 252, 256, 159, 160, 166, 172, 174, 174, 178, 178, 178, 178, 178, 179, 182, 185, 185, 186, 186, 187, 187, 187, 187, 187, 187, 188, 188, 192, 195, 195, 195, 195, 195, 196, 196, 196, 200, 200, 200, 200, 202, 203, 204, 207, 207, 207, 207, 207, 207, 207, 208, 212, 212, 226), out = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)), row.names = c(NA, -123L), class = c("tbl_df", "tbl", "data.frame"))
数据显示一个国家发生了作物疾病,我正试图首先建立Cox PH模型。survival
软件包手册建议在公式中定义术语cluster()
。
cm <- coxph(Surv(time =jday, event = out ) ~ cluster(yr), data = outdat)
Error in reformulate(temp[1 - tcl]) :
'termlabels' must be a character vector of length at least one
如果我不将协变定义为分组变量,则模型是拟合的。
cm <- coxph(Surv(time =jday, event = out ) ~ yr, data = outdat)
注意,我已经尝试将outdat$yr
的类更改为字符/因子。
cluster()
项调整危险的标准误差,但由于它是公式右侧的唯一项,因此没有协变量可调整。你至少需要一个协变。除非你有具体的理由,否则我不会包括集群术语。
请参阅此处了解更多信息