r语言 - 匹配数据框时的标识符范围



在下面的示例中,我需要根据两个不同的标识符(即日期id(匹配两个数据框。但是,我需要设置"标识符的范围":new_df <- merge(df1 , df2 , by = c(id , date +-1 day interval)此新数据框应包含[-1, +1]区间内发生的所有观测值。

下面的第一个数据每天都有值,我只需要删除不在上述区间的观测值。"零"日将位于第二个数据帧 (df2 (。

/

/第一个数据:

id <- c(a56 , a56 , a56 ,a56 ..., a1782)
date <-(1990-04-07 , 1990-04-08 , 1990-04-09 , 1990-04-10, ... , 1994-08-19)
value <- (0.003 , 0.023 , 0.127 , 0.278 , 0.378, ... ,0.378)
df1 <- data.frame(id ,date)
/

/秒数据:

 id <- c(a56 , a78 , a99 , a101, a1893 , a167 , a1782)
 date <-c(1990-04-10 , 1990-08-18 , 1990-10-17, 1991-04-10 , 1994-08-18 ,1995-10-17)
 df2 <- data.frame(id , date)

所需的输出如下:

1. a56  1990-04-09  0.278
2. a56  1990-04-10  0.378
3. a56  1990-04-11  0.444 .....
9999. a1782 1994-08-18  0.345
1000. a17882 1994-08-19 0.378  

提前感谢!

所以我有点猜测你的数据是什么样子的,因为你给出的示例代码并不完全有效(下次请仔细检查(。

请注意,我将日期投射到 Date .

我在这里所做的只是id上连接两个数据帧,所以我保留了两个日期列。我从df1中过滤日期,使其在 df2 日期的 +/-1 间隔内,然后删除df1日期列。

id <- c('a56', 'a56', 'a56', 'a56', 'a1782')
date <- as.Date(c('1990-04-07' , '1990-04-08' , '1990-04-09' , '1990-04-10', '1994-08-19'))
value <- c(0.003 , 0.023 , 0.127 , 0.278, 0.378)
df1 <- data.frame(id ,date, value)
id <- c('a56' , 'a78' , 'a99' , 'a101', 'a1893' , 'a167')
date <- as.Date(c('1990-04-10' , '1990-08-18' , '1990-10-17', '1991-04-10' , '1994-08-18' ,'1995-10-17'))
df2 <- data.frame(id , date)
df = merge(df1, df2, by = 'id', suffixes = c('', '.y'))
df = df[df$date >= df$date.y - 1 & df$date <= df$date.y +1, 1:3]

我得到:

   id       date value
3 a56 1990-04-09 0.127
4 a56 1990-04-10 0.278

相关内容

  • 没有找到相关文章

最新更新