机器学习模型是否有可能具有低测试误差和高训练误差?



当我们有大的测试误差和大的训练误差时,我们说这是一个偏差问题。当我们有低训练误差和高测试误差时,我们说它是方差问题。当训练误差和测试误差都足够低以至于可以接受时,我们说它是良好拟合或最佳拟合模型。

但是是否有可能有更多的训练误差而不是测试误差??? 如果是,那我们怎么说?? 此外,测试和训练集是随机选择的,因此无需事先设置!

Training    Test    Model
error       error
low         low     GOOD FIT
low         high    HIGH VARIANCE
high        high    HIGH BIAS
high        low     ????????

由于学习模型旨在减少训练误差(因为测试集在学习时不可用,因此"测试"),这是非常不可能的,我会说除非你专门创建一些发生这种情况的例子,否则它不会发生。

要做到这一点,训练集必须是高方差之一,或者与所选模型不兼容的训练集(例如,线性模型分离无法线性分离的数据)会产生高训练误差,对于任何测试集产生低训练误差,它必须不反映与给定训练集中相同的方差。如果遇到这样的问题,很可能是这些集合的构造不好。由于这种情况不太可能,我不知道给它起的任何名字

最新更新