r语言 - 插入符号包中用于重复CV的训练功能的种子设置



我需要在 R 中使用插入符号包确定 KNN 模型的重复 CV 的种子设置。

我的训练数据集有 12 列和 1000 行(二元响应中的第 1 列和其他 11 列是标准化预测变量(

如何正确确定"重复CV"50倍和5次重复的种子设置?

以下种子设置是否正确?

有人可以帮助理解重复CV和LOOCV的正确种子设置吗?

请参阅下面的代码。

set.seed(123)
seeds <- vector(mode = "list", length = 251)
for(i in 1:250) seeds[[i]] <- sample.int(1000, 11) 
## For the last model:
seeds[[251]] <- sample.int(1000, 1)

sample.int(( 中的 11 应该是参数的 #values。
在这种情况下,如果要评估每个模型中 KNN 的 11 个 K 值,请选择 11。详细地说,您将在一次重复 10 个 folod CV 中拥有 10 个模型以平均。在 10 个模型中的每一个模型中,train(( 将尝试 K.2 的 11 个值,
类似的问题已经有很好的答案。
在插入符号中设置种子并行随机森林 使用插入符号
完全可重现的并行模型

最新更新