神经网络-其中(机器学习)方法识别非定常运动的三维结构在多元时间序列



假设我有温度、风速、气压、湿度等的本地测量值,以时间序列的形式,这就是我从世界上所知道的全部。龙卷风时不时地从我的探测器上方掠过。

因为龙卷风不只是随机的东西,有一个模式,训练有素的眼睛可以在时间序列中识别…温度、风速等的一些变化以某种方式相互关联,周围有不可预测的波动。

我想用某种自动方式来识别时间序列中的间隔,这些间隔与我的探测器"看到"龙卷风的时期相对应。

哪种机器学习方法更适合识别它们,并给我一些相应的"可靠性系数"。

请注意,因为龙卷风本质上是一个不稳定的物体,而且以某种不稳定的方式移动,探测器并不总是看到相同的温度、风速等变化,因为龙卷风可以在探测器上来回移动,局部改变其形状等。我想我想说的是,时间序列测量结果并不符合这些量的实际空间分布,人们可以在龙卷风的"静止框架"中绘制这些量。然而,它总是看到"有点"相同的特征,周围有一些我的眼睛可以识别的随机性,这让我认为这是ML的合适任务。

其他问题:是否有一个python ML库可以实现推荐的方法?(PyBrain, Scikit ?…?)

很可能在数据的移动窗口上提取一些时间序列特征,手动将一些事件标记为龙卷风发生的正面示例,并将其余样本视为负面示例,然后拟合分类器将正面龙卷风事件与从传感器测量的随机天气条件区分开来。

你的数据中有多少这样的事件?如果你认为你需要至少100次龙卷风事件才能训练出一个足够可靠的模型,并对其预测精度有足够好的估计。

是否可以公开发布此数据集,例如在http://figshare.com?

机器学习算法种类繁多。未经进一步调查,您提供的信息并不表明任何一组算法优越。延长的时间序列确实表明你可能需要一种算法来创建简化的特征向量。神经网络不会自动为你提供可靠性系数。如果你愿意公开发布一个包含几百个随机正反例的数据集,那么随着时间的推移,可能会有许多不同的团队应用不同的算法。各种各样的"竞赛"网站可以加速这一过程。

相关内容

  • 没有找到相关文章

最新更新