制作了一个项目数量图。
我有一个包含日期(datetime格式)和类别项的大数据框架:
,
日期;类别;项目
2015-05-13 23:53:00;一个;B
我想按"一年中的每一天"做一个项目数量的图表。(圣诞节有多少件商品,不以年份为准)
到目前为止,我已经创建了一个新的列'DayOfYear',其中包含"month; day"以字符串形式(例如:12-24),并且我已按此属性分组以计算项目的数量df = df[['Category','DayOfYear']].groupby(['DayOfYear']).count()
它给了我一张离我想要的桌子不远的桌子:
> DayOfYear; Category > 1-1 ; 1801 > 1-10 ; 4829 > 1-11 ; 4971 > 1-12 ; 3964 > 1-13 ; 3116
但是当我把它放入图表时,它是无意义的:DayOfYear不反映日期,所以它按错误的顺序排序
你知道怎么做吗?我应该保留日期-时间格式吗?
我找到了一个方法:)
我没有为month-day创建字符串,而是添加了一个日期时间列,格式为%M-%d
然后我对数据进行分组,以计算一年中每天的项目数量,并根据分组数据