R:如何将日期向量转换为这些日期之间的间隔

我有一系列的日期(它们是班级日期(，代表某人做某事：

    mytimes = as.Date(c("2014-08-15", "2014-08-29", "2014-08-01", "2014-09-19", "2014-10-31"))

如何转动计算这些日期之间的时间，然后计算日期之间的中位时间？

我可以计算最早日期之后的几天：

    > sort(mytimes) - min(mytimes)
    Time differences in days
    [1]  0 14 28 49 91

但我想获得间隔：0 14 14 21 42

我有一个data.frame，我有多个用户/人每次登录系统时都有一个条目。我想总结登录之间的间隔。我希望有一些不错的方法可以做到这一点...我可以通过计算总时间并将我的条目数量分配来计算平均时间，但我也想要实际的分布，中位数等。理想情况下，我可以与Dplyr一起使用的东西总结用户分组的数据。

编辑：我刚刚发现了滞后

因此，我可以做类似的事情：

   dataset <- data.frame(ID = c(rep(1, 5), rep(2, 5)), times = rep(mytimes, 2))
    dataset %>% 
     arrange(ID, times) %>%
     group_by(ID) %>%
     mutate(diff_shift = times - lag(times))

# A tibble: 10 x 3
# Groups:   ID [2]
      ID times      diff_shift
   <dbl> <date>     <time>    
 1  1.00 2014-08-01 <NA>      
 2  1.00 2014-08-15 14        
 3  1.00 2014-08-29 14        
 4  1.00 2014-09-19 21        
 5  1.00 2014-10-31 42        
 6  2.00 2014-08-01 <NA>      
 7  2.00 2014-08-15 14        
 8  2.00 2014-08-29 14        
 9  2.00 2014-09-19 21        
10  2.00 2014-10-31 42

使用 dplyr，您可以根据示例数据像以下那样做。

，但是您需要意识到，取决于您的数据。帧的外观，您需要添加用户ID或更多变量的group_by。

library(dplyr)
df <- data_frame(mytimes = as.Date(c("2014-08-15", "2014-08-29", "2014-08-01", "2014-09-19", "2014-10-31")))
df %>% 
  # group_by(???)
  arrange(mytimes) %>% 
  mutate(time_diff = mytimes - lag(mytimes))
  mytimes    time_diff
  <date>     <time>   
1 2014-08-01 NA       
2 2014-08-15 14       
3 2014-08-29 14       
4 2014-09-19 21       
5 2014-10-31 42

基本r答案只是

> diff(sort(mytimes))
Time differences in days
[1] 14 14 21 42
> median(diff(sort(mytimes)))
Time difference of 17.5 days

您可能想在开始时添加一个0，具体取决于您的工作。

相关内容

最新更新

热门标签：