从每月索引 Python 返回一列'days in month'



我有一个每月值的时间序列,我想计算该月的天数(然后将该数字除以得到该月的每日平均值)。

我已经使用calendar.monthrange()通过循环访问值来计算它,但我正在查看pandas.DataFrame.apply方法 (https://medium.com/@rtjeannier/pandas-101-cont-9d061cb73bfc),想知道如何使用它而不是循环?

下面的代码给了我想要的输出,但出于效率(和学习)的目的,我想通过使用 apply 方法而不是循环来了解更好的方法来做到这一点。

import pandas as pd
import calendar
df = pd.DataFrame()
df['temp'] = pd.date_range(start='01-Jan-2000', end='31-Dec-2018', freq='MS')  
df['value'] = 5
df.set_index('temp', inplace=True)
days_list = []
for val in df.index:
days_list.append(calendar.monthrange(val.year, val.month)[1])
df['days_in_month'] = days_list

通过使用这个,我可以很好地轻松地找到索引一行的天数:

calendar.monthrange(df.index[0].year, df.index[0].month)[1]

但是,如果我尝试对许多值执行此操作(见下文),它会抛出错误,我缺少如何在两者之间找到的方法。

calendar.monthrange(df.index.year, df.index.month)[1]

最终目标是创建一个列(就像循环一样),但更有效,并且不需要创建不必要的列表,循环遍历,然后将列表添加到数据帧。

mapdf.index一起使用:

df['days_in_month'] = df.index.map(lambda val: calendar.monthrange(val.year, val.month)[1])

如何将索引列设置为常规列,然后使用daysinmonth

df['days_in_month'] = df.index.daysinmonth

最新更新