如何在我的分析数据集中创建一个变量fold,该变量被分配了caret
中createFolds
交叉验证函数的1:k值?
例如,使用以下大学招生数据集:
# Load data.
mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
folds <- createFolds(mydata$admit, k=5)
# Create variable "mydata$fold" and assign values of 1:5 to mydata$fold.
?
您可以使用createFolds
执行此操作,它有一个参数list
,默认为TRUE
,给出每个折叠中的标记列表。如果您将其更改为FALSE
,函数将返回每行被分配到的折叠的向量。
folds <- createFolds(mydata$admit, k=5,list = FALSE)
有关详细信息,请参见?createFolds
。