具有第一个非null唯一值的groupby agg



以下代码给出错误

import pandas as pd
import numpy as np
df=pd.DataFrame({"item":['a','a','b'],"item1":['b','d','c']})
df.groupby("item").agg(model_list=("item1", np.unique))

由于a项有两个唯一值(即bd(,如何修改它以返回第一个非空唯一值?

使用默认情况下删除缺失值的GroupBy.first,因此返回第一个未缺失值:

df=pd.DataFrame({"item":['a','a','b','b','b'],"item1":['b','d',np.nan, np.nan, 'c']})

df = df.groupby("item").agg(model_list=("item1", 'first'))
print (df)
model_list
item           
a             b
b             c

最新更新