从 R 中的表中读取自定义日期时间时出错



我想这样做:在read.table/read中为colClasses参数指定自定义日期格式.csv

csv 中的日期时间字符串的格式为"2010-08-18T09:50:00.000+02:00"。最后一部分是与格林威治标准时间的区别。

所以我调整了上面问题中给出的解决方案:

> setClass("myDateTime")
[1] "myDateTime"
> setAs("character","myDateTime", function(from) as.POSIXlt(from, tz=paste("GMT", substr(from,24,24), substr(from,26,26), sep=""), format="%Y-%m-%dT%H:%M:%S") )

到目前为止,一切正常:

> as("2010-08-18T09:50:00.000+02:00", "myDateTime")
[1] "2010-08-18 09:50:00 GMT+2"

但是当尝试从csv文件中读取数据时,会出现一个错误:

> text <- "num;source;date1;date2
+ 1000000001;test;1985-11-17T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00
+ 1000000047;test;1971-03-07T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00
+ 1000000128;test;1967-11-02T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00"
> tab2 <- read.table(textConnection(text), sep=";", header=T, row.names=NULL, quote="", colClasses = c("numeric","character","myDateTime","myDateTime"), na.string=c(""))
Error in strptime(x, format, tz = tz) : invalid 'tz' value

我找不到错误来自哪里。你可以帮我吗?

tz长度必须为 1。

因此

setAs("character","myDateTime", function(from){
  as.POSIXlt(from, 
     tz = paste("GMT", unique(substr(from,24,24)), 
                       unique(substr(from,26,26)), sep="",collapse=''), 
     format="%Y-%m-%dT%H:%M:%S")
 })

应该工作

相关内容

  • 没有找到相关文章