熊猫定义了一个季节来计算统计数据



我正在使用具有时间索引的熊猫数据框架。我有好几年的每日数据,我需要做一些季节性的比较。

我知道我可以使用truncate方法来提取周期并创建新的时间序列,但我想知道我是否可以定义一个自定义的"周期"(例如5月1日至9月1日)。然后,我想计算两个不同时间序列之间的相关系数,仅在这段时间内。有办法做到这一点吗?

一些示例数据:

import pandas as pd
import numpy as np
rng = pd.date_range('1/1/2000', periods=4380, freq='D')
df = pd.DataFrame(np.random.randn(4380, 4), index=rng)

问题:

我想计算这些时间序列上的相关系数(好吧,对于随机数据它没有那么多意义…但无论如何,只在特定时期。也就是说,只有在"春天"one_answers"冬天"之间的相关性是什么?我可以把春天和冬天定义为自定义时期吗?基本上,我只是想"掩盖"在感兴趣的季节之外的句号

您可以通过df.index.month获得索引的月份,然后使用np。选择你想要的:

df[np.in1d(df.index.month, [1, 2, 3, 10, 11, 12])]

最新更新