使用K折交叉验证对多个种子评估模型的正确方法是什么?



我正在使用三个随机种子上的 5 倍 CV 训练深度学习模型(随机种子用于模型初始化,CV 拆分一次(。对于每个折叠,我保存最佳模型。因此,我在模拟后得到了 15 个模型。为了评估性能,我从这 15 个模型中取最好的(在整个评估过程中保持不变(,并使用每个种子的所有 5 个模型的验证折叠对其进行评估。然后,我平均这些种子的结果。

我想知道我在这里做的事是否正确。

我读到有两种方法可以计算CV性能:[1]池化,其中性能是在所有测试集的并集上全局计算的[2]平均,其中每个测试集的性能是单独计算的,结果是这些测试集的平均值。

我打算使用方法二(平均(。

是的,您可以使用 5 倍 CV 的平均方法,但我不明白您所说的"对于每个折叠,我保存最佳模型"是什么意思。此外,三个随机种子值是不够的。您应该使用至少 10 个不同的值,并为这些种子中的相应结果绘制箱线图。

相关内容

  • 没有找到相关文章

最新更新