R dlnm:交叉基变换和分布滞后非线性模型,如何使系数回到原来的尺度



由于R包dlnm,我正在估计一个分布式滞后非线性模型。自变量是时间t的家庭消费,自变量是时间t-1到t- l的天气状况。第一步是利用天气暴露历史矩阵构造一个交叉基矩阵,使暴露维和时间维都可以灵活地建模(crossbasis())。这个交叉基被插入到用lm()估计的ols回归中。dlnm包提供了一些函数来绘制和总结结果(crosspred()crossreduce())。

我们如何得到"原始"尺度下的参数,即交叉基变换之前的参数?

我为一些规格找到了这样做的方法(见下文),但是有一个通用的方法吗?

在下面的例子中,曝光维度被建模为二阶多项式,时间维度被建模为线性函数。

library(dlnm)
cb <- crossbasis(chicagoNMMAPS$temp,lag=30,
         argvar=list("poly",degree=2),
         arglag=list("lin"))
model <- lm(cvd~cb,chicagoNMMAPS)
pred <- crosspred(cb,model,at=-20:30)
plot(pred,"slices",lag=0)
# my dirty way:
LAG<-0
SCALE<-attributes(cb)$argvar$scale
ce<-attributes(cb)$argvar$cen
B1<-(summary(model)$coeff[2,1]+summary(model)$coeff[4,1]*LAG)/SCALE
B2<-(summary(model)$coeff[3,1]+summary(model)$coeff[5,1]*LAG)/(SCALE^2)
B0<--(ce*B1+(ce^2)*B2)
xx<-(-20:30)
xx2<-xx^2
yhat<-B0+B1*xx+B2*xx2
lines(-20:30,yhat,lty=2,col="blue")

如下图所示,B是正确的(蓝色虚线与通过dlnm包产生的红线完全对齐)。经过一番争论,我找到了我的"肮脏的方式",背后没有多少数学意义。

输入图片描述

对于所有类型的函数形式,它们是一种更直接地得到B的方法吗?

解决方法是将argvar函数中的scale参数设置为1。然后crossreduce函数给出原始尺度的参数。下面的例子:

# with a poly of degree 2 with natural splines at knots 3 and 10
library(dlnm)
cb <- crossbasis(chicagoNMMAPS$temp,lag=30,
             argvar=list("poly",degree=2,scale=1),
             arglag=list("ns",knots=c(3,10)))
model <- lm(cvd~cb,chicagoNMMAPS)
pred <- crosspred(cb,model,at=-20:30)
plot(pred,"slices",lag=3)
ce<-attributes(cb)$argvar$cen
xx<-(-20:30)
xx2<-xx^2
redvar<-crossreduce(cb, model,type="lag",value=3)
b1<-redvar$coefficients[1]
b2<-redvar$coefficients[2]
b0<--(ce*b1+(ce^2)*b2)
yhat<-b0+b1*xx+b2*xx2
lines(-20:30,yhat2,lty=2,col="green")

最新更新