r语言 - 基于水年创建日指数



我正在处理水文数据,我需要水年。 我已经根据之前在此论坛上发布的函数成功创建了一个水年专栏。 我想要的是一个从 1-365(闰年为 366(的伴随water day,以匹配水年序列。 请注意,水年由其结束的日历年指定。例如,2010 水年从 2009 年 10 月 1 日开始,到 2010 年 9 月 30 日结束。

基本上,我想要一列,每当日期到达每年的 10 月 1 日时,它就会从 1-365(闰年为 366(开始序列。

我的数据集范围从 1950 年到 2099 年,所以我需要某种方法来自动化这个过程。 这个问题的闰年部分给我带来了麻烦。

我在下面提供了创建数据集的代码。

# Create a data_set with datetime, year, month, day, jd, wtr_yr
library(lubridate)
datetime <- seq(as.Date("1950/1/1"), as.Date("2099/12/31"), by = "day")
year <- year(datetime)
month <- month(datetime)
day <- day(datetime)
julian_day <- yday(datetime)
# make dataframe with all time components
datetime_dataframe <- data.frame(datetime, year, month, day, julian_day)
# Create function to derive water year. Credit goes to Caner and MrFlick.
wtr_yr <- function(dates, start_month=10) {
  # Convert dates into POSIXlt
  dates.posix = as.POSIXlt(dates)
  # Year offset
  offset = ifelse(dates.posix$mon >= start_month - 1, 1, 0)
  # Water year
  adj.year = dates.posix$year + 1900 + offset
  # Return the water year
  adj.year
}
#  Use fn to add water year to the dataframe
datetime_dataframe$wtr_yr <-wtr_yr(datetime_dataframe$datetime)
head(datetime_dataframe)

这是一种可能的方法。我从 1949-10-01 创建了日期序列。我先添加了water.year。无论月份 == 9 和天 == 30 的行都被标记并标记为 1。其余变为 0。使用此列,我为水年创建了一个分组变量。 cumsum(c(F, diff(water.year) < 0))正在做这项工作。有了分组变量后,我创建了日期序列。我将最终结果的一部分留在下面。

library(dplyr)
library(lubridate)
mydata <- data.frame(date = seq(as.Date("1949-10-01"),as.Date("2099-12-31"), by = "day")) %>%
          mutate(year = year(date),
                 month = month(date),
                 day = day(date),
                 julian_day = yday(date),
                 water.year = if_else(month == 9 & day == 30, 1, 0))
mydata %>%
group_by(water.year = cumsum(c(F, diff(water.year) < 0))) %>%
mutate(water.day = 1:n())
         date year month day julian_day water.year water.day
1  1952-09-01 1952     9   1        245          2       337
2  1952-09-02 1952     9   2        246          2       338
3  1952-09-03 1952     9   3        247          2       339
28 1952-09-28 1952     9  28        272          2       364
29 1952-09-29 1952     9  29        273          2       365
30 1952-09-30 1952     9  30        274          2       366

这应该有效。我只是使用了difftime并注意到您希望wtr_day是前wtr_yr中从 9-30 的天数。

library(tidyverse)
new_df <- datetime_dataframe %>%
  group_by(wtr_yr) %>% 
  mutate(wtr_day = (as.integer(difftime(datetime,ymd(paste0(wtr_yr - 1 ,'-09-30')), units = "days"))))

最新更新