我正在通过一个在固定效应模型中使用交互作用项的R示例。可以在此处找到该示例。
该示例使用fixest
包并使用语法var::fe(ref)
。我不明白ref
是什么以及它在这里做什么。如何选择ref
的值?
我在谷歌上遇到了这样的解释:"您可以使用i(factor_var, continuous_var, ref)
将数值变量与"类因子"变量进行交互,其中continuous_var
将与factor_var
的每个值进行交互,并且参数ref
是factor_var
的值作为参考(可选)。 - 我不明白这个"参考"在这里的作用。
任何见解将不胜感激。
当您估计具有作为一系列虚拟变量输入的类别预测变量或等效的固定效应模型的模型时,必须始终省略其中一个假人以避免完全共线性。您省略的假人是"参考类别"。
参考类别的选择是任意的,它不会改变模型的预测,但它确实会影响您解释剩余虚拟变量的系数的方式。这是众所周知的,在大多数回归入门教科书中也是如此。
在fixest
中,您可以使用i()
函数的ref
参数来确定将省略哪个类别。下面,您将看到drat
系数保持不变,但其他系数会因为参考类别的变化而变化:
library(fixest)
library(modelsummary)
mod1 <- lm(mpg ~ drat + factor(cyl) * hp, data = mtcars)
mod2 <- feols(mpg ~ drat + hp * i(cyl), data = mtcars)
#> The variable 'hp:cyl::8' has been removed because of collinearity (see $collin.var).
mod3 <- feols(mpg ~ drat + hp * i(cyl, ref = 8), data = mtcars)
models <- list(mod1, mod2, mod3)
modelsummary(models, fmt = 6)
Model 1 | Model 2 | ||
---|---|---|---|
26.771696 | 26.771696 | 13.796313 | |
(8.719507) | (8.719507) | (5.057123) | |
1.939525 | 1.939525 | 1.939525 | |
(1.646230) | (1.646230) | (1.646230) | |
-12.041741 | |||
(7.883606) | |||
因子(cyl)8 | -12.975383 | ||
(6.689497) | |||
-0.096854 | -0.023706 | -0.023706 | |
(0.047378) | (0.018221) | (0.018221) | |
factor(cyl)6 × hp | 0.080976 | ||
(0.071010) | |||
factor(cyl)8 × hp | 0.073149 | ||
(0.052855) | |||
style="文本对齐:左;">cyl = 6 | -12.041741 | 0.933642 | |
(7.883606) | (7.341465) | ||
-12.975383 | |||
(6.689497) | |||
-0.073149 | -0.073149 | ||
(0.052855) | (0.052855) | ||
hp × cyl = 6 | 0.007828 | 0.007828 | |
(0.053174) | (0.053174) | ||
12.975383 | |||
(6.689497) | |||
Num.Obs. | 32 | 32 | |
0.799 | 0.799 | 0.799 | |
R2 调整。 | 0.751 | 0.751 | |
169.4 | 169.4 | 169.4 | |
181.1 | 181.1 | 181.1 | |
Log.Lik. | style="文本对齐:居中;">-76.677 | ||
16.601 | |||
2.66 | 2.66 | 2.66 | |
IID | IID |