如何在python中提取给定时间序列的2小时间隔



我目前正在分析NetCDF文件中的一些降雨数据,提取数据后,我生成了1979-2020:年之间1小时最大降雨量的时间序列

import glob
import numpy as np
from netCDF4 import Dataset
import pandas as pd
import xarray as xr
all_years = []
for file in glob.glob('*.nc'):
#print(file)
data = Dataset(file, 'r')
time = data.variables['time']
year = time.units[11:16]
all_years.append(year)

year_start = '01-01-1979'
year_end = '31-12-2021'
date_range = pd.date_range(start = str(year_start),
end = str(year_end), 
freq = 'H')
df = pd.DataFrame(0.0,columns = ['tp'], index = date_range)
lat_freetown = 8.4657
lon_freetown = 13.2317
all_years.sort()
for yr in range(1979,2021):
data = Dataset('era5_year' + str(yr)+ '.nc', 'r')

lat = data.variables['latitude'][:]
lon = data.variables['longitude'][:]

sq_diff_lat = (lat - lat_freetown)**2
sq_diff_lon = (lon - lon_freetown)**2

min_index_lat = sq_diff_lat.argmin()
min_index_lon = sq_diff_lon.argmin()

tp = data.variables['tp']

start = str(yr) + '-01-01'
end = str(yr) + '-12-31'
d_range = pd.date_range(start = start, 
end = end, 
freq = 'H')

for t_index in np.arange(0, len(d_range)):
print('Recording the value for: ' + str(d_range[t_index])+str(tp[t_index, min_index_lat, min_index_lon]))
df.loc[d_range[t_index]]['tp'] = tp[t_index, min_index_lat, min_index_lon]

daily = df.resample('D').max()`

从这里开始,我需要分析这个系列的2小时持续时间。我想我可能可以再次使用重采样功能与"2H":

df.resample('2H').max()

但我需要以这样一种方式分析数据,即它读取sliding scale上的数据,例如:

  1. 下午1点到3点的数据
  2. 下午2点至4点的数据
  3. 下午3点至5点的数据……等

如果有人知道一种方法,我可以用这种方式分析我的时间序列,间隔2小时,还可以分析其间的时间,那么我们将非常感谢您的帮助!

使用接收窗口的rolling方法

df.rolling('2H').max()

最新更新