我正在使用R中预测包中的auto.arima来确定傅立叶级数的最佳K项。
在我这样做之后,我想计算季节性,并将一个季节性变量插入多元回归模型。
使用预测包中的数据集,我能够提取傅立叶项的最佳数量:
library(forecast)
##Public dataset from the forecast package
head(gas)
##Choose Optimal Amount of K-Terms
bestfit <- list(aicc=Inf)
for(i in 1:6)
{
fit <- auto.arima(gas, xreg=fourier(gas, K=i), seasonal=FALSE)
if(fit$aicc < bestfit$aicc)
bestfit <- fit
else break;
optimal_k_value<-max(i)
print(i)
}
##Extract Fourier Terms
seasonality<-data.frame(fourier(gas, K=optimal_k_value))
##Convert Gas TS Data to Dataframe
gas_df <- data.frame(gas, year = trunc(time(gas)),
month = month.abb[cycle(gas)])
##Extract True Seasonality by Taking Sum of Rows
seasonality$total<- rowSums(seasonality)
##Combine Seasonality to Month and Year
final_df<-cbind(gas_df, seasonality$total)
seasonality$total
列是否会被视为"季节性变量",以便以后建模,还是需要添加系数?
否,seasonality$total
不是季节性变量。要看到这一点,请注意,fourier(gas, K = optimal_k_value)
的每一列只是从-1到1的季节性分量,因此它们只是sin(…(和cos(…(,没有任何系数。很明显,不同的季节成分必须有不同的系数,所以你不应该只是把它们相加。
旁注1:由于i
始终只是一个数字,因此使用max(i)
没有意义,只使用optimal_k_value <- i
就足够了。
旁注2:我建议检查
plot(resid(auto.arima(gas, xreg = fourier(gas, K = optimal_k_value), seasonal = FALSE)))
首先,可能存在低于年频率的季节性(fourier
似乎不允许考虑这一点(,尽管你可能会将其单独建模为一种趋势。此外,将数据拆分为1970年前后的数据可能是个好主意。