R 中时间序列的虚拟值



我有一个数据集,其中一列表示每月日期:从 02/01/2004 到 09/01/2008,我必须为 2008 年的日期创建一个假人。我尝试使用:

dummy <- as.numeric(Date >= 01/01/2008)

但R对我说:

">= 对因子没有意义">

因此,我尝试将因子变量 Date 转换为数字变量 Date,但我所有的日期都消失了,取而代之的是一些随机数。

这将创建一些数据:

dat <- data.frame(
date = c("01/01/2017", "02/01/2017", "01/01/2018")
)

现在我们首先得到正确的日期格式,然后我们创建虚拟人:

dat$date <- strptime(as.character(dat$date), "%d/%m/%Y") # correct date format
dat$date <- format(dat$date, "%Y-%m-%d") # change to Date variable
# create dummy:
dat$dummy <- 0 
dat$dummy[which(dat$date >= "2018-01-01")] <- 1

输出:

date dummy
1 2017-01-01     0
2 2017-01-02     0
3 2018-01-01     1

一行命令,使用@RLave的答案:

dat$dummy <- as.numeric(dat$date >= "2018-01-01")

最新更新