机器学习:如何一起处理离散和连续数据



我正在发布询问是否有任何方法或有关如何处理分类问题中离散和连续数据的想法。

在我的情况下,我有一堆具有离散数据的独立"批次"。这是相关的数据,因此,对于每批,都有单独的点。我也有一个数据集,随着时间的时间而变化。但是,这次每批都有很多时间观察。数据集如下所示:

Data Set 1
Batch 1      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 2      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 3      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 4      DiscreteInfo(1)      DiscreteInfo(2) ....... DiscreteInfo(n)
Data Set 2
Batch 1      t(1)      TimeData
Batch 1      t(2)      TimeData 
Batch 1      t(3)      TimeData
Batch 1      t(4)      TimeData
.
.
.
.
Batch n     (t1)      TimeData
Batch n     (t2)      TimeData
Batch n     (t3)      TimeData

我正在尝试对所有这些数据分类是否属于"好"批次,"坏"批次或" So-So"批次。这是由一个特定的离散参数确定的(数据集未使用(。

我是机器学习的新手;任何意见或想法都将不胜感激。我正在使用MATLAB分类学习者来解决此问题。

在处理分类问题时需要考虑一些事情。

  1. 培训数据。我们需要进行分类的培训数据,I-E我们需要上述所有属性的值以及类价值,无论是"好"或"坏"还是" so-so"。
  2. 使用此功能我们可以训练模型,然后为所有训练有素的属性提供了新数据,我们可以预测其属于哪个类别。

就离散和连续而言,我们处理离散和连续数据的方式没有差异。实际上,在这种情况下,我们可以生成一个新属性,该属性将是给定批处理的所有其他时间变量的函数,然后执行分类。如果您提供数据集的实例,则可以更精确地回答问题。

最新更新