如何找出熊猫的重采样函数起到了作用



我使用python模块pandas及其函数resample来计算数据集的平均值。我想知道我如何才能知道每天/每个月的重新采样发生了什么N。在下面给出的例子中,我计算了1月、2月和3月这三个月的平均值。在这种情况下,我的问题的答案是:N表示1月=31,N表示2月=29,N表示3月=31。对于更复杂的数据,有没有办法获得关于N的信息?

import pandas as pd
import numpy as np
#create dates as index
dates = pd.date_range('1/1/2000', periods=91)
index = pd.Index(dates, name = 'dates')
#create DataFrame df
df = pd.DataFrame(np.random.randn(91, 1), index, columns=['A'])
print df['A']
#calculate monthly_mean
monthly_mean = df.resample('M', how='mean')

提前谢谢。

您可以使用how='count',IIUC:

>>> df.resample('M', how='count')
2000-01-31  A    31
2000-02-29  A    29
2000-03-31  A    31
dtype: int64

最新更新