如何在 R 中的回归中设置虚拟变量

以下是我的数据

y   r1  r2  r3
1   0.1 0.2 -0.3
2   0.7 -0.9    0.03
3   -0.93   -0.32   -0.22

1.第一个问题是我怎样才能得到这样的输出：

y   r1     r2    r3    dummy_r1  dummy_r2 dummy_r3
1   0.1    0.2   -0.3    0        0          1
2   0.7   -0.9   0.03    0        1          0
3   -0.93 -0.32  -0.22   1        1          1

注意：我希望负数据等于1，正数据等于0

2.第二个问题是，如果我想做这样的回归：lm(y~r1+r2+r3+dummy_r1+ dummy_r2+dummy_r3)，如果我不想使用上面的输出data(dummy_r1,dummy_r2,dummy_r3)，我该怎么办，因为它不方便。

使用末尾注释中可重现显示的DF，定义DF2也具有sign.*列，然后对其运行回归。当然，您在问题中没有足够的数据来实际获得这么多预测因子的系数，但如果在您的实际问题中您有更多的数据，那么应该没问题。

DF2 <- cbind(DF, sign = +(DF[-1] < 0))
lm(y ~., DF2)

给：

Call:
lm(formula = y ~ ., data = DF2)
Coefficients:
(Intercept)           r1           r2           r3      sign.r1  
1.425       -1.163       -1.543           NA           NA  
sign.r2      sign.r3  
NA           NA

注意

Lines <- "y   r1  r2  r3
1   0.1 0.2 -0.3
2   0.7 -0.9    0.03
3   -0.93   -0.32   -0.22"
DF <- read.table(text = Lines, header = TRUE)

注意

相关内容

最新更新

热门标签：