在MLR
R包中,有一些方法可以聚合参数调优模型的性能指标,如train.mean
、train.sd
、test.mean
、test.sd
。我想知道聚合过程是如何完成的。 根据我目前的知识,聚合似乎是在折叠级别进行的。
假设对于 10 次重复、5 倍交叉验证,总共有 10*5 个测试误差估计值,因此测试误差的标准差是 50 个估计值的变化。 但我想要的是重复级别的误差估计,所以对于每次重复,我有一个由内 5 倍平均的误差估计,然后我期望的测试误差标准差应该是 10 次重复的 10 次估计的变化。
我想知道如何做到这一点。有没有办法提取每个重采样中每个调谐参数的原始性能指标?
正确,聚合是在折叠级别完成的。
没有在重复级别聚合的已实现选项,您必须自己编写代码。
我们不会再将此功能添加到 {mlr}。请参阅此问题,了解如何在 {mlr3} 中执行此操作。
我发现有两个聚合函数似乎在重复级别"testgroup.sd"和"testgroup.mean"上工作。从他们在 mlr.mlr-org.com/reference/aggregations.html 的描述