在下面的示例中,我需要根据两个不同的标识符(即日期和 id(匹配两个数据框。但是,我需要设置"标识符的范围":new_df <- merge(df1 , df2 , by = c(id , date +-1 day interval)
此新数据框应包含[-1, +1]
区间内发生的所有观测值。
下面的第一个数据每天都有值,我只需要删除不在上述区间的观测值。"零"日将位于第二个数据帧 (df2
(。
/第一个数据:
id <- c(a56 , a56 , a56 ,a56 ..., a1782)
date <-(1990-04-07 , 1990-04-08 , 1990-04-09 , 1990-04-10, ... , 1994-08-19)
value <- (0.003 , 0.023 , 0.127 , 0.278 , 0.378, ... ,0.378)
df1 <- data.frame(id ,date)
//秒数据:
id <- c(a56 , a78 , a99 , a101, a1893 , a167 , a1782)
date <-c(1990-04-10 , 1990-08-18 , 1990-10-17, 1991-04-10 , 1994-08-18 ,1995-10-17)
df2 <- data.frame(id , date)
所需的输出如下:
1. a56 1990-04-09 0.278
2. a56 1990-04-10 0.378
3. a56 1990-04-11 0.444 .....
9999. a1782 1994-08-18 0.345
1000. a17882 1994-08-19 0.378
提前感谢!
所以我有点猜测你的数据是什么样子的,因为你给出的示例代码并不完全有效(下次请仔细检查(。
请注意,我将日期投射到 Date
.
我在这里所做的只是在id
上连接两个数据帧,所以我保留了两个日期列。我从df1
中过滤日期,使其在 df2
日期的 +/-1 间隔内,然后删除df1
日期列。
id <- c('a56', 'a56', 'a56', 'a56', 'a1782')
date <- as.Date(c('1990-04-07' , '1990-04-08' , '1990-04-09' , '1990-04-10', '1994-08-19'))
value <- c(0.003 , 0.023 , 0.127 , 0.278, 0.378)
df1 <- data.frame(id ,date, value)
id <- c('a56' , 'a78' , 'a99' , 'a101', 'a1893' , 'a167')
date <- as.Date(c('1990-04-10' , '1990-08-18' , '1990-10-17', '1991-04-10' , '1994-08-18' ,'1995-10-17'))
df2 <- data.frame(id , date)
df = merge(df1, df2, by = 'id', suffixes = c('', '.y'))
df = df[df$date >= df$date.y - 1 & df$date <= df$date.y +1, 1:3]
我得到:
id date value
3 a56 1990-04-09 0.127
4 a56 1990-04-10 0.278