给定股票A具有d个特征的n个样本,我们可以建立一个(d+1(维线性模型来预测利润。然而,在一些书中,我发现,如果我们有m个不同的股票,每个股票都有n个样本和d个特征,那么他们将这些数据合并,得到m*n个具有d个特征的样本,以建立一个单(d+1(维线性模型来预测利润。
我的困惑是,不同的股票之间通常没有什么联系,它们的利润受到不同因素和环境的影响,那么为什么它们可以合并来建立一个单一的模型呢?
如果你使用R作为选择的工具,你可能喜欢嵌入howto及其附录的时间序列——这背后的数学是Taken定理:
[Takens定理给出了]条件,在这些条件下,可以根据对动力学系统状态的一系列观测来重建混沌动力学系统。
在我看来,你引用的语句似乎正与这个定理有关:对于d
特征(我们很幸运,如果我们知道这个数字——我们通常不知道(,我们需要d+1
维度。
如果需要预测更多的时间序列,如果特征相同,我们可以使用相同的嵌入空间。维度d
通常是简单的变量(例如,不同能源商品股票的温度(——这个例子帮助我直观地理解了这个想法。
进一步阅读
- 使用嵌入进行预测