R中的as.formula似乎不接受以数字后跟_开头的名称



如何避免得到以下错误。as.formula()似乎不接受以数字开头并后跟_(下划线)的变量。我是动态生成这些变量,我在一个阶段,我不想回去,改变变量名称。由于

lhsOfFormula = "25_dep"
rhsOfFormula  = "predVar1+predVar2+10_predVar3"
as.formula(paste(lhsOfFormula , " ~ ", rhsOfFormula ))
错误:

> as.formula(paste(lhsOfFormula , " ~ ", rhsOfFormula ))
Error in parse(text = x) : <text>:1:3: unexpected input
1: 25_
     ^

您需要将名称用反号括起来,就像这样

> lhsOfFormula <- "25_dep"
> rhsOfFormula <- c("predVar1", "predVar2", "10_predVar3")
> addq <- function(x) paste0("`", x, "`")
> as.formula(paste(addq(lhsOfFormula) , " ~ ", paste(addq(rhsOfFormula),collapse=" + " )))
`25_dep` ~ predVar1 + predVar2 + `10_predVar3`

我也模糊地记得有一个函数来帮助创建公式,像formulate,也许?但是我在快速搜索中找不到任何关于它的信息。

编辑:感谢@DWin,这是reformulate,这有助于响应,但不是预测器。这里将RHS更改为具有有效的名称,以便代码能够工作:

> lhsOfFormula = "25_dep"
> rhsOfFormula  = c("predVar1", "predVar2", "x10_predVar3")
> reformulate(rhsOfFormula, lhsOfFormula)
`25_dep` ~ predVar1 + predVar2 + x10_predVar3

编辑:将公式直接应用于数据帧将自动添加反引号,使用第一列作为响应

> d <- data.frame(`25_dep`=1:5, predvar1=1:5, predvar2=1:5, `10_predvar3`=1:5, 
                  check.names=FALSE)
> formula(d)
`25_dep` ~ predvar1 + predvar2 + `10_predvar3`

该函数的代码(stats:::formula.data.frame)可以改写;它像这样使用as.name:

> lhsOfFormula <- "25_dep"
> rhsOfFormula <- c("predVar1", "predVar2", "10_predVar3")
> ns <- sapply(c(lhsOfFormula, rhsOfFormula), as.name)
> formula(paste(ns[1], paste(ns[-1], collapse="+"), sep=" ~ "))
`25_dep` ~ predVar1 + predVar2 + `10_predVar3`

最新更新