以下是我的数据
y r1 r2 r3
1 0.1 0.2 -0.3
2 0.7 -0.9 0.03
3 -0.93 -0.32 -0.22
1.第一个问题是我怎样才能得到这样的输出:
y r1 r2 r3 dummy_r1 dummy_r2 dummy_r3
1 0.1 0.2 -0.3 0 0 1
2 0.7 -0.9 0.03 0 1 0
3 -0.93 -0.32 -0.22 1 1 1
注意:我希望负数据等于1,正数据等于0
2.第二个问题是,如果我想做这样的回归:lm(y~r1+r2+r3+dummy_r1+ dummy_r2+dummy_r3)
,如果我不想使用上面的输出data(dummy_r1,dummy_r2,dummy_r3)
,我该怎么办,因为它不方便。
使用末尾注释中可重现显示的DF
,定义DF2
也具有sign.*
列,然后对其运行回归。当然,您在问题中没有足够的数据来实际获得这么多预测因子的系数,但如果在您的实际问题中您有更多的数据,那么应该没问题。
DF2 <- cbind(DF, sign = +(DF[-1] < 0))
lm(y ~., DF2)
给:
Call:
lm(formula = y ~ ., data = DF2)
Coefficients:
(Intercept) r1 r2 r3 sign.r1
1.425 -1.163 -1.543 NA NA
sign.r2 sign.r3
NA NA
注意
Lines <- "y r1 r2 r3
1 0.1 0.2 -0.3
2 0.7 -0.9 0.03
3 -0.93 -0.32 -0.22"
DF <- read.table(text = Lines, header = TRUE)