如何计算以分钟为单位的连续两行时间戳的时间差,并将结果添加到新列中。
我试过这个:
data$hours <- as.numeric(floor(difftime(timestamps(data), (timestamps(data)[1]), units="mins")))
但只能从时间零点及以后得到差异。
添加了我想添加的带有"mins"列的示例数据
timestamps mins
2013-06-23 00:00:00 NA
2013-06-23 01:00:00 60
2013-06-23 02:00:00 60
2013-06-23 04:00:00 120
与[1]一起使用的代码总是引用时间戳向量的第一个元素。
要做您想做的事情,您需要查看除第一个元素外的所有元素减去除最后一个元素以外的所有元素。
mytimes <- data.frame(timestamps=c("2013-06-23 00:00:00",
"2013-06-23 01:00:00",
"2013-06-23 02:00:00",
"2013-06-23 04:00:00"),
mins=NA)
mytimes$mins <- c(NA, difftime(mytimes$timestamps[-1],
mytimes$timestamps[-nrow(mytimes)],
units="mins"))
这个代码的作用是:
- 设置数据帧,使
timestamps
和mins
的长度保持不变 - 在该数据框架内,输入您拥有的时间戳以及您还没有任何分钟的事实(即
NA
) - 选择除第一个元素外的所有时间戳
mytimes$timestamps[-1]
- 选择时间戳
mytimes$timestamps[-nrow(mytimes)]
中除最后一个元素外的所有元素 - 用分钟为单位减去它们
difftime
(因为它们的格式很好,所以不必首先使它们成为POSIXct对象)。units="mins"
- 将NA放在前面,因为您的差异比
c(NA, ...)
行少一个 - 将所有这些放回原始数据帧的mins列
mytimes$mins <-
另一种选择是用这种方法计算:
# create some data for an MWE
hrs <- c(0,1,2,4)
df <- data.frame(timestamps = as.POSIXct(paste("2015-12-17",
paste(hrs, "00", "00", sep = ":"))))
df
# timestamps
# 1 2015-12-17 00:00:00
# 2 2015-12-17 01:00:00
# 3 2015-12-17 02:00:00
# 4 2015-12-17 04:00:00
# create a function that calculates the lag for n periods
lag <- function(x, n) c(rep(NA, n), x[1:(length(x) - n)])
# create a new column named mins
df$mins <- as.numeric(df$timestamps - lag(df$timestamps, 1)) / 60
df
# timestamps mins
# 1 2015-12-17 00:00:00 NA
# 2 2015-12-17 01:00:00 60
# 3 2015-12-17 02:00:00 60
# 4 2015-12-17 04:00:00 120