如何在bigglm中消除"外来函数调用中的NA / NaN / Inf (arg 3)"

  • 本文关键字:quot NaN NA Inf arg bigglm 函数调用 r
  • 更新时间 :
  • 英文 :


我是R的新手,我正在做一些物流回归模型。我正在尝试针对具有 200+ 变量的 1M 记录数据运行 bigglm。我的变量由数字和整数 (0/1( 组成,因为我已将其设置为指标,例如

isOK,quantity,weight,isUS,isEU,isASIA
0,2,1.1,0,0,1
1,1,0.9,1,1,0

但是,bigglm 总是抛出错误

coef.bigqr(object$qr( 中的错误: 外来函数调用中的 NA/NaN/Inf (参数 3(

从 traceback((,它显示以下内容

14: coef.bigqr(object$qr)
13: coef(object$qr)
12: coef.biglm(iwlm)
11: coef(iwlm)
10: bigglm.function(formula = formula, data = datafun, ...)
9: bigglm(formula = formula, data = datafun, ...)
8: bigglm(formula = formula, data = datafun, ...)
7: bigglm.data.frame(myForm, data = myraw.data[i, , drop = FALSE], 
family = binomial(link = logit))
6: bigglm(myForm, data = myraw.data[i, , drop = FALSE], family = binomial(link = logit))
5: bigglm(myForm, data = myraw.data[i, , drop = FALSE], family = binomial(link = logit)) at trial.r#48
4: eval(ei, envir)
3: eval(ei, envir)
2: withVisible(eval(ei, envir))
1: source("trial.r")

我做了一些研究,有人提到bigglm应该在块中具有所有可能的值/因素,但是,我的所有变量都是数字/指标,我认为这不是必需的(如果我弄错了,请纠正我(。无论如何,我已经重新排列了我的数据集,使得第一个块(对于我的情况,我将其设置为3000,如下所示(,所有整数变量都有0或1的记录。

for (i in chunk(myraw.data, by=3000)){
if (i[1]==1){
myFullLRModel <- bigglm(myForm, data=myraw.data[i,,drop=FALSE], family=binomial(link=logit))
}else{
myFullLRModel <- update(myFullLRModel, myraw.data[i,,drop=FALSE])
}
}

您能否就发生上述错误的原因提供建议?我无法运行 glm,因为它总是返回内存不足。

如果你有 0/1 个变量,并且在一个块中没有观察到零(即,列是常量的(,这将导致系数NA,这可能会产生你面临的问题。

最新更新