r语言 - panelAR无法将我的整数识别为整数



https://easyupload.io/3rnesm

所以我使用以下数据集:

# A tibble: 1,136 x 17
ccode  year vanhdemo pcgnp  left ainew sdnew milctr2 britinfl  lpop  iwar  cwar popinc pcginc polrtnew lag_ainew lag_sdnew
<dbl> <int>    <dbl> <dbl> <dbl> <dbl> <dbl>   <dbl>    <dbl> <dbl> <dbl> <dbl>  <dbl>  <dbl>    <dbl>     <dbl>     <dbl>
1     2  1980     18.7  11.3     0     1     1       0        1  19.2     0     0   1.01   7.51        7        NA        NA
2     2  1981     18.7  12.3     0     1     1       0        1  19.3     0     0   1.01   7.99        7         1         1
3     2  1982     18.7  13.2     0     1     1       0        1  19.3     0     0   1.01   7.39        7         1         1
4     2  1983     18.7  14.2     0     1     1       0        1  19.3     0     0   1.01   7.69        7         1         1
5     2  1984     16.1  15.5     0     1     1       0        1  19.3     0     0   1.01   9.66        7         1         1
6     2  1985     16.1  16.5     0     1     1       0        1  19.3     0     0   1.01   6.24        7         1         1
7     2  1986     16.1  17.5     0     1     1       0        1  19.3     0     0   1.01   5.86        7         1         1
8     2  1987     16.1  18.6     0     2     2       0        1  19.3     0     0   1.01   6.39        7         1         1
9    20  1980     25.6  10.2     0     1     1       0        1  17.0     0     0   1.08   9.01        7        NA        NA
10    20  1981     25.6  10.7     0     1     1       0        1  17.0     0     0   1.08   5.77        7         1         1
# ... with 1,126 more rows

正如您所看到的,R将变量year识别为一个整数。最初,列值是数值,但我将它们转换为整数。然而,当我运行以下代码(使用panelAR包)时,我遇到了麻烦:

panelAR(vanhdemo ~ pcgnp + left + lpop + iwar + milctr2 + britinfl, data = dat, 
panelVar = "ccode", timeVar = "year", autoCorr = "psar1", panelCorrMethod = "pcse",
rho.na.rm = TRUE, panel.weight = "t-1", bound.rho = TRUE)

我收到这个错误消息:

Error: The time variable must be defined as an integer.

我不明白我在这里做错了什么。如果我重新创建数据集的一部分(如下所示),则模型运行良好。那么,问题是否根源于数据集(最初是.dta文件)?如果有人感兴趣的话,我绝对可以上传。

以下是相同数据的一个小例子:

ccode  <- c(rep(2,8), rep(20, 2))
year  <- c(1980:1987, 1980, 1981)
vanhdemo <- c(rep(18.7, 4), rep(16.1, 4), rep(25.6, 2))
pcgnp  <- c(11.3, 12.3 , 13.2, 14.2, 15.5, 16.5, 17.5, 18.6, 10.2, 10.7)
dat <- data.frame(ccode, year, vanhdemo, pcgnp)

错误与data.framestibbles的不同行为有关。Tibbles是一种特殊的数据框架,可以"防止维度下降"。如果您尝试用单个列名对tibble进行子集设置,你会得到一个专栏tibble。然而,根据你如何对data.frame进行子集划分,你可能会得到一个向量或data.frame.你看到的错误就是由这种区别造成的。内部panelAR()为时间变量的数据对象子集:

time.vec <- data[, timeVar]

因此,如果"data"是tibble,那么"time.vec"将是单列tibble,而如果"data"是data.frame,那么"time.vec"将是一个向量。panelAR()则检查"time.vec"是否为整数向量,并在数据对象为tibble的情况下抛出错误。

您可以在样本数据中看到这种行为,如下所示:

# make a tibble 
dat_tib <- tibble::as_tibble(dat)
# returns a vector
dat[, "year"]
# returns a data.frame
dat["year"]
# returns a tibble
dat_tib[, "year"]
# returns a tibble
dat_tib["year"]

在@xilliam的评论中回答。解决方案是将表从tibble转换为数据帧。

最新更新