我有一个数据帧,我可以使用df.display()在Jupiter Notebook中看到,当我把它写到excel时,e



我需要按以下列对数据进行分组,并获得答案的最新日期

df_Q = df.groupby(['question', 'user_id', 'options', 'answer'])
df_Date = df_Q.agg(Recent_Date=('datetime', np.max))

我认为这是因为您的数据帧只有一列,因为其余的都已转换为"多索引行轴标签";通过groupby+agg。

尝试添加:

df_Date = df_Date.reset_index()

导出到Excel之前。

注意,每个问题每个人可能会得到一个以上的答案,因为你包括";回答";在您的groupby中。我认为,根据你的目标;user_id";以及";问题";也许就足够了。

最新更新