我有一个CSV表,其中包含一个包含不同格式日期字符串的日期列。我想写一个小函数,尝试将这些字符串转换为日期对象。这个想法是尝试不同的日期格式,直到可以解析日期:
parseDate <- function(date){
formats <- c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S", "%m-%d-%Y-%H:%M:%S")
for(format in formats){
newDate <- strptime(date, format=format)
if(!is.na(newDate)){
return(newDate)
}
}
print(paste0("Invalid input: ", date))
return(NA)
}
column1 <- c("2014-11-14 14:20:16", "24.11.14 9:48", "24.11.14 9:49")
table <- data.frame(column1)
table$column1 = lapply(table$column1, FUN = parseDate)
问题是我找不到将此函数应用于列的正确方法。我尝试了lapply
、apply
和by
,但这些函数都不能提供所需的输出。你能帮我一下吗?
也许这个:
> do.call("c", lapply(table$column1, FUN = parseDate))
[1] "2014-11-14 14:20:16 AEDT" "2014-11-24 09:48:00 AEDT"
[3] "2014-11-24 09:49:00 AEDT"
您可以尝试parse_date_time
,它可以采用多种"格式"
library(lubridate)
parse_date_time(table$column1, c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S",
"%m-%d-%Y-%H:%M:%S"))
#[1] "2014-11-14 14:20:16 UTC" "2014-11-24 09:48:00 UTC"
#[3] "2014-11-24 09:49:00 UTC"