r语言 - xts to.weekly 返回星期五和星期一作为一周的结束



我似乎无法在 xts 中获取to.weeklyendpointsto.weekly 使用)函数,为我提供大多数类型的日期数据的正确结束日。我在xts软件包的CRAN和R-Forge版本中都遇到了这个问题。

它似乎与这里讨论的问题相似但不完全相同:XTS to.weekly 返回不同的每周端点。

对于我拥有的示例数据,to.weekly函数为不同周的周五和周一,默认indexAt="endof",周二为indexAt="startof"

我使用的是标准普尔500指数的每日回报率:

library(quantmod)
getSymbols("^GSPC", from="1961-12-15", to="1962-01-15", src="yahoo")
weekdays(index(to.weekly(GSPC))) # Fridays and mondays
[1] "Monday" "Friday" "Friday" "Monday" "Monday"
我尝试将对象的时区从我的时区更改为 UTC,

将我的系统时区更改为 UTC 和我的本地时区,并使用转换为 POSIXct 的原始日期重新创建 xts 对象。我的尝试都没有成功。

发现从to.weekly中获得我期望的行为的唯一方法是创建一个日期向量作为字符串,然后将它们转换为 POSIXct 而不是 Date 以用作新 xts 对象的索引。不幸的是,我无法将其与我的实际数据一起使用。

dates <-
c("1961-12-15","1961-12-18","1961-12-19","1961-12-20","1961-12-21","1961-12-22",
  "1961-12-26","1961-12-27","1961-12-28","1961-12-29","1962-01-02","1962-01-03",
  "1962-01-04","1962-01-05","1962-01-08","1962-01-09","1962-01-10","1962-01-11",
  "1962-01-12","1962-01-15")
data <- rep(1, length(dates))
p <- xts(data, order.by=as.POSIXct(dates))
d <- xts(data, order.by=as.Date(dates))
# Last day in the week, as expected
weekdays(index(to.weekly(p)))
# [1] "Friday" "Friday" "Friday" "Friday" "Friday" "Monday"
# First day in the week, as expected
weekdays(index(to.weekly(p, indexAt="startof")))
# [1] "Friday"  "Monday"  "Tuesday" "Tuesday" "Monday"  "Monday" 
# Mix of first and last days, not expected
weekdays(index(to.weekly(d)))
# [1] "Monday" "Friday" "Friday" "Monday" "Monday"

由于对日期使用 POSIXct 值似乎适用于字符值,我想我会尝试使用价格数据。

GSPCp <- xts(coredata(GSPC), order.by=as.POSIXct(index(GSPC)))
weekdays(index(to.weekly(GSPCp)))                # Not as expected
[1] "Monday" "Friday" "Friday" "Monday" "Monday"

怀疑问题是时区(和缺乏经验)问题,但我已经用尽了我能想到的所有方法来让它返回此数据系列中每周结束时的值。

我目前正在运行 xts_0.9.874。

------编辑------

正如WaltS在下面指出的那样,这似乎是POSIXct使用Unix时间的事实的一个问题,Unix时间从1970-01-01开始。在此时间之前的日期可能应该会出现奇怪的行为。

我今天做了一些实验,增加了17年和4个闰日,将指数转移到1978-1979年,该指数与1961-1962年在同一天共享一周中的相同日期。果然,to.weekly在转移到 1970 年之后的相同数据上工作得很好。

d <- GSPC
index(d) <- index(d)+365*17+4 # 1978-1979
weekdays(index(to.weekly(d)))
[1] "Friday" "Friday" "Friday" "Friday" "Friday" "Monday"

由于这似乎是使用 POSIX 时间的固有品质,因此我认为这不再是我使用 to.weeklyendpoints 的问题,而是时间格式的结构问题。我需要找到一种不同的方法来识别 1970 年之前日期的周端点。

我同意Quantmod数据似乎很好。 to.weekly() 似乎也适用于像 GSPC 这样的 xts 对象。 您遇到的问题似乎1970-01-01被用作POSIXct时代的起源。 为了更好地说明这一点,请考虑以下示例

GSPC1970 <- getSymbols("^GSPC", from="1970-12-15", to="1971-03-19", src="yahoo", auto.assign=FALSE)
to.weekly(GSPC1970)
weekdays(index(to.weekly(GSPC1970)))
 [1] "Friday"   "Thursday" "Thursday" "Friday"   "Friday"   "Friday"   "Friday"   "Friday"   "Friday"   "Friday"   "Friday"   "Friday"  
[13] "Friday"   "Friday" 

其中输出符合预期。 特别是从1969年到1970年的时期

GSPC1969 <- getSymbols("^GSPC", from="1969-11-15", to="1970-03-20", src="yahoo", auto.assign=FALSE)
to.weekly(GSPC1969)
weekdays(index(to.weekly(GSPC1969)))
 [1] "Monday" "Monday" "Monday" "Monday" "Monday" "Monday" "Friday" "Friday" "Friday" "Friday" "Friday" "Friday" "Friday" "Friday"
[15] "Friday" "Friday" "Friday" "Friday"

星期一返回为 1969 年周的周末,而星期五为 1970 年的日期。 问题可能与 on() 的 endpoint () = "周"和其他可能的时间有关。 您是否有必要处理 1970 年之前的数据?

-----------更新--------------

我认为问题更多地在于 endpoints() 或它使用的函数,而不是更基本的东西。 无论如何,下面的函数to.weekly.df()是to.weekly()的替代方法,它将quantmod数据从xts对象转换为以日期为列的数据框。 它还添加了一列,其中包含一个周数,计算从 1970-01-01 开始的周数,并将星期日作为一周的第一天。 它使用周数将数据框拆分为周,然后应用以获取每周的汇总数据,并将其作为数据框返回。 还有一个小的辅助函数可以将 xts 数据转换为 data.frame。

xts2df <- function(xts_data) data.frame(date=index(xts_data),coredata(cbind(xts_data, week=(as.numeric(index(xts_data))+5)%/%7)))
to.weekly.df <- function(xts_data) {
  df <- xts2df(xts_data)
  weekly <- t(sapply(split(df, df$week), 
                 function(x) c(date=tail(x$date,1), Open=x[1,2], High=max(x[,3]), 
                               Low=min(x[,4]), Close=tail(x[,5], 1),
                               Volume=sum(x[,6]), Adjusted=tail(x[,7],1) ) ) )
 weekly <- data.frame(date=as.Date(weekly[,1]), weekly[,-1])
 return(weekly)
}

对于 1970-01-01 后的数据,这似乎给出了与 to.weekly() 相同的结果,以及在此之前一段时间的正确结果。 如果您有任何问题,请告诉我。

最新更新