我使用函数resample将每日数据更改为pandas数据帧的月度数据。通过阅读文档,我发现我可以定义rule='M'或rule='MS'。第一个是";日历月末";第二个是";日历月开始";。两者之间有什么区别?
它不设置与重新采样组的索引相同的日期。
这里有一个例子:
date = pd.Series([0,1,2],
index=pd.to_datetime(['2022-01-15',
'2022-01-20',
'2022-02-15']))
2022-01-15 0
2022-01-20 1
2022-02-15 2
dtype: int64
# resampling MS:
date.resample('MS').mean()
2022-01-01 0.5
2022-02-01 2.0
Freq: MS, dtype: float64
# resampling M:
date.resample('M').mean()
2022-01-31 0.5
2022-02-28 2.0
Freq: M, dtype: float64
请注意索引日期的差异。对于"MS",组的日期始终是月的第一天,对于"M",则是最后一天。