我需要按以下列对数据进行分组,并获得答案的最新日期
df_Q = df.groupby(['question', 'user_id', 'options', 'answer'])
df_Date = df_Q.agg(Recent_Date=('datetime', np.max))
我认为这是因为您的数据帧只有一列,因为其余的都已转换为"多索引行轴标签";通过groupby+agg。
尝试添加:
df_Date = df_Date.reset_index()
导出到Excel之前。
注意,每个问题每个人可能会得到一个以上的答案,因为你包括";回答";在您的groupby中。我认为,根据你的目标;user_id";以及";问题";也许就足够了。