插入符号训练控制中的回测或自定义拆分



有什么方法可以让train()使用数据的自定义训练/测试分区运行?我对回测时间序列数据感兴趣(当传统的重采样/CV/等不合适/泄漏时)。即,如果数据从 1...N 开始按时间排序,那么我在某个截止之前反复训练数据,以预测截止后的数据(最多达到某个滑动窗口大小)。我无法确定如何在利用其余插入符号train()的同时做到这一点。提前感谢您的任何提示。

Max 在这里。

您可以在 trainControl(index = list()) 中指定自定义重采样索引,其中列表包含用于训练的训练数据元素。

。但是 train() 将使用其他所有内容作为保留,我认为这不是您想要的。

我可能对此功能有大约 10 个不同的请求。需要一些修改来训练()才能做到这一点,但它应该不会太糟糕。

但是,1)我不了解时间序列分析(除了简单的基础知识),所以一些带有一两个测试示例的原型代码会有所帮助,2)直到我完成这本书(大约 4 个月),我真的没有时间这样做。

因此,如果您愿意贡献一些技术位并且可以等待几个月(可以根据您希望的积极性来减少),则可以通过一些修改来完成。

如果您想进一步讨论,请向包装上列出的地址发送电子邮件。

最新更新