我有一些通过他们的GET搜索获得的Twitter数据。日期具有以下 GMT 格式。
Thu, 19 Jul 2012 01:32:43 +0000
Thu, 19 Jul 2012 01:32:43 +0000
Thu, 19 Jul 2012 01:32:40 +0000
Thu, 19 Jul 2012 01:32:39 +0000
Thu, 19 Jul 2012 01:32:36 +0000
Thu, 19 Jul 2012 01:32:32 +0000
Thu, 19 Jul 2012 01:32:28 +0000
Thu, 19 Jul 2012 01:32:27 +0000
Thu, 19 Jul 2012 01:32:28 +0000
Thu, 19 Jul 2012 01:32:27 +0000
Thu, 19 Jul 2012 01:32:18 +0000
知道我怎样才能将它们转换为 UTC 格式吗? 最好Unix
和/或R
解决办法。
更新:通过 UTC,我的意思是以秒为单位的 UTC 时间戳。例如:1318394558。
使用date
工具,可能是这样的:
date -f file.txt "+%Y-%m-%d %H:%M:%S %Z"
结果:
2012-07-19 11:32:43 EST
2012-07-19 11:32:43 EST
2012-07-19 11:32:40 EST
2012-07-19 11:32:39 EST
2012-07-19 11:32:36 EST
2012-07-19 11:32:32 EST
2012-07-19 11:32:28 EST
2012-07-19 11:32:27 EST
2012-07-19 11:32:28 EST
2012-07-19 11:32:27 EST
2012-07-19 11:32:18 EST
或者,类似这样的内容:
date -f file.txt "+%F %T"
给:
2012-07-19 11:32:43
2012-07-19 11:32:43
2012-07-19 11:32:40
2012-07-19 11:32:39
2012-07-19 11:32:36
2012-07-19 11:32:32
2012-07-19 11:32:28
2012-07-19 11:32:27
2012-07-19 11:32:28
2012-07-19 11:32:27
2012-07-19 11:32:18
编辑:
date -f file.txt -u +%s
结果:
1342661563
1342661563
1342661560
1342661559
1342661556
1342661552
1342661548
1342661547
1342661548
1342661547
1342661538
呵呵
in R
,
dat <- c("Thu, 19 Jul 2012 01:32:43 +0000",
"Thu, 19 Jul 2012 01:32:43 +0000",
"Thu, 19 Jul 2012 01:32:40 +0000",
"Thu, 19 Jul 2012 01:32:39 +0000")
as.POSIXct(dat, format="%a, %d %b %Y %H:%M:%S %z")
#[1] "2012-07-18 20:32:43 CDT" "2012-07-18 20:32:43 CDT" "2012-07-18 20:32:40 CDT" "2012-07-18 20:32:39 CDT"
请参阅?strptime
或者,如果你想要数字
as.numeric(as.POSIXct(dat, format="%a, %d %b %Y %H:%M:%S %z"))
[1] 1342661563 1342661563 1342661560 1342661559