我需要在 R 中使用插入符号包确定 KNN 模型的重复 CV 的种子设置。
我的训练数据集有 12 列和 1000 行(二元响应中的第 1 列和其他 11 列是标准化预测变量(
如何正确确定"重复CV"50倍和5次重复的种子设置?
以下种子设置是否正确?
有人可以帮助理解重复CV和LOOCV的正确种子设置吗?
请参阅下面的代码。
set.seed(123)
seeds <- vector(mode = "list", length = 251)
for(i in 1:250) seeds[[i]] <- sample.int(1000, 11)
## For the last model:
seeds[[251]] <- sample.int(1000, 1)
sample.int(( 中的 11 应该是参数的 #values。
在这种情况下,如果要评估每个模型中 KNN 的 11 个 K 值,请选择 11。详细地说,您将在一次重复 10 个 folod CV 中拥有 10 个模型以平均。在 10 个模型中的每一个模型中,train(( 将尝试 K.2 的 11 个值,
类似的问题已经有很好的答案。
在插入符号中设置种子并行随机森林 使用插入符号
完全可重现的并行模型