异常检验-带t或不带t的线性回归?理解设置的问题



如果你想检查股票数据中的异常,许多研究都使用线性回归。假设你想检查是否有星期一的影响,这意味着星期一比其他日子糟糕得多。我知道我们可以使用这样的回归:return=a+b DummyMon+ea是常数,b是回归系数,我们有星期一的Dummy和误差项e。这就是我在python中使用的:首先,在异常中添加一个常量:

anomaly = sm.add_constant(anomaly)

然后构建模型:

model = sm.OLS(return, anomaly)

您适合的型号:

results = model.fit()
  1. 我想知道这是否是正确的模型设置
  2. 在这种情况下,线性回归图将只显示两个垂直区域,分别高于0(对于非星期一(和1(对于星期一(,并显示所有回报。它看起来很奇怪。这是正确的吗
  3. 我应该以某种方式尝试在回归中使用时间(t(吗?如果是,我该如何使用python?我想过给每次约会增加一个数字,但后来我想知道如何对待周末
  4. 我假设,对于许多数据点,如果时间序列是平稳的,两种方法都是相似的,对吧?最后,我做了一个横截面分析,在这种情况下不关心时间序列的方面,对吗?(我听说了GARCH模型等,这是不同的(

嗯,我只是在学习,希望有人能给我一些关于这个话题的想法。事先非常感谢。

对于时间序列分析任务(如预测或异常检测(,您可能需要更高级的模型,如深度学习中的递归神经网络(RNN(。您可以将任何时间步长分配给RNN小区,在您的情况下,每个RNN小区可以代表一天,也可以代表一小时或半天等。

RNN的主要目的是使模型了解数据中的时间相关性。例如,如果星期一影响不好,那么相应的RNN小区将具有合理的参数。我建议你对此做一些进一步的研究。这里有一些文件可能会有所帮助:

https://colah.github.io/posts/2015-08-Understanding-LSTMs/(还包括不同类型的RNN(

https://towardsdatascience.com/understanding-rnn-and-lstm-f7cdf6dfc14e

您可以使用tensorflow、keras或PyTorch库。

最新更新