Data:我有不同国家和因素的时间序列数据,例如从1972年到2007年"阿富汗"的出生率(来源)。
目标:例如预测2008年和2012年的出生率
问题:我熟悉线性回归,但需要一些有关如何使用时间序列数据和预测未来值的帮助。
你能指出我的例子或分享代码片段吗?
查看statsmodels
时间序列分析模块。时间序列模型通常基于自相关,该模块具有标准的单变量(对于单个时间序列)AR(p)
和MA(p)
模型,以及允许unit roots
的组合版本ARIMA
。您还可以找到多变量(对于各种相互关联的时间序列)VAR
模型。
这是一个使用 pandas
和 statsmodels
进行统计分析和预测的time series
教程。
您可以在 R 中使用ARIMA
模型和VAR
模型。
ARIMA
: 自回归积分移动平均模型
VAR
: 向量自回归模型
对于ARIMA
型号:单击此处
对于VAR
型号:单击此处
对于一个时序数据,请使用ARIMA
模型,但是,如果多个时序数据彼此相关,请使用VAR
模型。