我使用python模块pandas
及其函数resample
来计算数据集的平均值。我想知道我如何才能知道每天/每个月的重新采样发生了什么N。在下面给出的例子中,我计算了1月、2月和3月这三个月的平均值。在这种情况下,我的问题的答案是:N表示1月=31,N表示2月=29,N表示3月=31。对于更复杂的数据,有没有办法获得关于N的信息?
import pandas as pd
import numpy as np
#create dates as index
dates = pd.date_range('1/1/2000', periods=91)
index = pd.Index(dates, name = 'dates')
#create DataFrame df
df = pd.DataFrame(np.random.randn(91, 1), index, columns=['A'])
print df['A']
#calculate monthly_mean
monthly_mean = df.resample('M', how='mean')
提前谢谢。
您可以使用how='count'
,IIUC:
>>> df.resample('M', how='count')
2000-01-31 A 31
2000-02-29 A 29
2000-03-31 A 31
dtype: int64