用字符串计算64岁以上的人



我的熊猫df有一个包含家庭成员生日的列,看起来像这样:

Birthyear_household_members
1960
1982 + 1989
1941
1951 + 1953
1990 + 1990
1992

我想用一个变量创建一个列,该变量包含一个家庭中64岁以上的人数。因此,对于每一行,我需要分隔字符串并计算出生年份在1956年之前的人数。

我如何使用pandas来做这个?我原来的df很大。

尝试使用您的df

df['cnt'] = df['Birthyear_household_members'].apply(lambda x: len([None for year in x.split(" + ") if year < '1956']))

最新更新