我目前正在处理一个问题,我真的不知道如何描述它。
我有两列,其中一列用两位数字显示小时(例如10表示上午10点到上午10点59分,17表示下午17点到下午17点59分(。第二列显示KIOSK ID对小时的引用。Kiosk ID的每一次出现都代表一次客户访问。
数据帧
我需要画出每个售货亭的高峰时间。
我尝试使用pd.crosstabs连接这两列,但不幸的是,我不知道如何检索每小时的最大值,以及如何将每小时的最高值分配给相应的kiosk。到目前为止,我得到的只是以下内容:
合并两列
感谢添加图片的提示。如有任何帮助,我们将不胜感激!!
尝试按小时和信息亭分组,
import pandas as pd
df = pd.DataFrame({'hour': [10,10,10,10,12,12,12],
'kiosk': ['A','A','A','B','A','A','C']})
df.groupby(['hour','kiosk']).size().unstack()
kiosk A B C
hour
10 3.0 1.0 NaN
12 2.0 NaN 1.0