计算自相关(ACF):强制到Unicode:需要字符串或缓冲区,找到浮点数



我想使用来自pandas.plotting的自相关图来检查时间序列中的随机性。我的数据帧如下所示:

DATE                reqUser     sum_event_count
0   2017-10-08 21:00:00 bddfdpadm   92542.0
1   2017-10-11 06:00:00 bscdpadm    1913.0
2   2017-10-11 11:00:00 ambari-qa   240.0
3   2017-10-11 14:00:00 A454275     6834.0
4   2017-10-13 04:00:00 cdndpadm    20737.0 

我试过这个:

from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df)

我有此错误消息:

TypeError: coercing to Unicode: need string or buffer, float found

问题出在哪里?请帮忙 ?感谢!

我认为需要像 ayhan 评论的那样通过Series

文档中的自相关:

自相关图通常用于检查时间序列中的随机性。这是通过计算不同时间滞后的数据值的自相关来完成的。如果时间序列是随机的,则对于任何和所有时滞分离,此类自相关应接近于零。如果时间序列是非随机的,则一个或多个自相关将明显不为零。图中显示的水平线对应于 95% 和 99% 置信带。虚线为 99% 置信带。

from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df['sum_event_count'])

如果需要time series添加set_index

from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df.set_index('DATE')['sum_event_count'])

最新更新