如何在 R 中的回归中设置虚拟变量



以下是我的数据

y   r1  r2  r3
1   0.1 0.2 -0.3
2   0.7 -0.9    0.03
3   -0.93   -0.32   -0.22

1.第一个问题是我怎样才能得到这样的输出:

y   r1     r2    r3    dummy_r1  dummy_r2 dummy_r3
1   0.1    0.2   -0.3    0        0          1
2   0.7   -0.9   0.03    0        1          0
3   -0.93 -0.32  -0.22   1        1          1

注意:我希望负数据等于1,正数据等于0

2.第二个问题是,如果我想做这样的回归:lm(y~r1+r2+r3+dummy_r1+ dummy_r2+dummy_r3),如果我不想使用上面的输出data(dummy_r1,dummy_r2,dummy_r3),我该怎么办,因为它不方便。

使用末尾注释中可重现显示的DF,定义DF2也具有sign.*列,然后对其运行回归。当然,您在问题中没有足够的数据来实际获得这么多预测因子的系数,但如果在您的实际问题中您有更多的数据,那么应该没问题。

DF2 <- cbind(DF, sign = +(DF[-1] < 0))
lm(y ~., DF2)

给:

Call:
lm(formula = y ~ ., data = DF2)
Coefficients:
(Intercept)           r1           r2           r3      sign.r1  
1.425       -1.163       -1.543           NA           NA  
sign.r2      sign.r3  
NA           NA  

注意

Lines <- "y   r1  r2  r3
1   0.1 0.2 -0.3
2   0.7 -0.9    0.03
3   -0.93   -0.32   -0.22"
DF <- read.table(text = Lines, header = TRUE)

最新更新