机器学习,强调某些观察结果



我有一个多级机器学习问题,我将尝试在逻辑回归,决策树,多层perceptron等上尝试不同的方法。

数据集中的观测值具有一个属性,该属性是1-5的索引,它定义了某个观察值正确分类的重要性(索引1非常重要,5根本不重要)。我的问题是:

问题1:我应该如何强调较低索引观察的模型更为重要的模型?我正在考虑复制这些观察结果,以使模型更适合较低的索引观测值,其他方法是其他方法?

问题2:我可以使用哪些绩效评估标准找到可以很好地预测这些较低索引观察的模型?(通过计算正确预测的实例之间的索引分布。)

问:

答案1:更频繁地介绍训练集的重要模式是为此的标准方法。如果您的培训算法具有类似Leraning率(例如使用反向流动)之类的东西,则也可以增加此参数的高优先级模式。

答案2:我将使用加权均方根错误,并给出高优先级模式的错误。

最新更新