我正在研究一个时间序列,其中包含 2 年半的每日销售数据。该项目的目的是估计营销支出对销售的影响,同时考虑季节性和趋势。
我计划使用统计模型包中的未观察到的组件。我的问题是,外生因素的系数是与季节性、趋势和周期分量一起估计的,还是在减去季节性、趋势和周期后根据残差估计外生因素?
所有内容都是一起估计的,这意味着在首先单独估计其他分量之后,外生参数的系数不会在残差上估计。
有两种不同的方法来估计外生数据的系数(同样,无论哪种方法都同时估计所有分量和系数,而不是按顺序估计(:
首先,如果mle_regression=True
(这是默认值(,则通过最大似然法估计外生变量上的系数(以及模型的其他参数,通常包括趋势、季节性等的方差项(,然后将向量exog.dot(coeffs)
用作模型的截距。
如果mle_regression=False
,则通过卡尔曼滤波估计系数。
这两种方法是等效的,即使在小样本中,它们通常给出几乎完全相同的估计值。