我有一个大数据集,由9664行组成。我是非常新的编码,所以我感谢任何帮助!.
这是我的数据:
UserId Date Part_of_day Apps Category Frequency Duration_ToT
1 2020-09-10 evening Settings System tool 1 3.436
1 2020-09-11 afternoon Calendar Calendar 5 9.965
1 2020-09-11 afternoon Contacts Phone_and_SMS 7 2.606
2 2020-09-11 afternoon Facebook Social 15 50.799
2 2020-09-11 afternoon clock System tool 2 5.223
3 2020-11-18 morning Contacts Phone_and_SMS 3 1.726
3 2020-11-18 morning Google Productivity 1 4.147
3 2020-11-18 morning Instagram Social 1 0.501
.......................................
67 2020-11-18 morning Truecaller Communication 1 1.246
67 2020-11-18 night Instagram Social 3 58.02
我想通过持续时间和频率获得每个用户使用的类别的平均值。我试图通过在许多时间段内使用的类别的平均值来表示每个用户。
使用df.groupby
函数
df.groupby(['UserId','Category']).Frequency.mean()