我的数据框架中有2列,我想对其执行添加小时或添加天数等操作。
例如,我想检查我的date2是否在[date1;日期1 + 30天]
我试过了:
table(data$date1 <= data$date2 & data$date2 <= data$date1 + 30)
我得到这个错误:
Error in data$date1 + 30 :
non-numeric argument to binary operator
我将date1和date2转换为日期格式:
data$date1 <- substr(data$date1,1,16)
data$date1 <- format(data$date1, format="%Y-%m-%d %H:%M")
这是我的数据头:
id1 id2 date2 date1
1 CD0H 15741 2012/02/08 10:03 16/02/2015 16:22
2 CD00 15058 2011/05/19 09:25 07/05/2015 10:39
3 CHY0 15987 2011/01/20 11:58 06/02/2015 14:11
4 CTPO 15254 2010/09/29 12:45 01/04/2015 04:49
5 CDHY 15051 06/05/2015 15:01
6 CDJU 15035 17/04/2015 08:56
可能到Date/Time-objects的转换不起作用:
library( lubridate )
data <- read.table( filename, header=TRUE, sep = ";" )
data$date1 <- substr(data$date1,1,16)
data$date1 <- format(data$date1, format="%Y/%m/%d %H:%M")
data$date2 <- substr(data$date2,1,16)
data$date2 <- format(data$date2, format="%d/%m/%Y %H:%M")
类仍然是'character':
> class(data$date1)
[1] "character"
我做了如下的转换:
library( timeDate )
table <- read.table( filename, header=TRUE, sep = ";",
colClasses = c( "factor", "numeric", "character", "character" ))
data <- cbind( table[1:2],
apply( table[3], 2, FUN=function(x){ timeDate(x,format="%Y/%m/%d %H:%M") } ),
apply( table[4], 2, FUN=function(x){ timeDate(x,format="%d/%m/%Y %H:%M") } ) )
colnames(data) <- colnames(table)
这个更详细,但至少我们有时间和日期:
> class(data$date1)
[1] "POSIXct" "POSIXt"
> (data$date1 <= data$date2 + as.difftime(4*365,units="days")) & (data$date2 <= data$date1 + as.difftime(30,units="days"))
[1] TRUE TRUE FALSE FALSE NA NA
查看lubridate
库来处理日期和时间。
这是如何使用润滑油增加30天的方法
library(lubridate)
ymd('2011-01-01') + days(30)
[1] "2011-01-31 UTC"
查看更多信息:
http://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html