我想使用来自pandas.plotting的自相关图来检查时间序列中的随机性。我的数据帧如下所示:
DATE reqUser sum_event_count
0 2017-10-08 21:00:00 bddfdpadm 92542.0
1 2017-10-11 06:00:00 bscdpadm 1913.0
2 2017-10-11 11:00:00 ambari-qa 240.0
3 2017-10-11 14:00:00 A454275 6834.0
4 2017-10-13 04:00:00 cdndpadm 20737.0
我试过这个:
from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df)
我有此错误消息:
TypeError: coercing to Unicode: need string or buffer, float found
问题出在哪里?请帮忙 ?感谢!
我认为需要像 ayhan 评论的那样通过Series
。
文档中的自相关:
自相关图通常用于检查时间序列中的随机性。这是通过计算不同时间滞后的数据值的自相关来完成的。如果时间序列是随机的,则对于任何和所有时滞分离,此类自相关应接近于零。如果时间序列是非随机的,则一个或多个自相关将明显不为零。图中显示的水平线对应于 95% 和 99% 置信带。虚线为 99% 置信带。
from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df['sum_event_count'])
如果需要time series
添加set_index
:
from pandas.plotting import autocorrelation_plot
autocorrelation_plot(df.set_index('DATE')['sum_event_count'])