R-火车，测试，验证和结合数据，混合数据和测试数据之间有什么区别

帮助我了解这两个摘要之间的区别

set.seed(123)
ss <- sample(1:3,size=nrow(dataframe),replace=TRUE,prob=c(0.6,0.2,0.2))
train <- mtcars[ss==1,]
test <- mtcars[ss==2,]
cvr <- mtcars[ss==3,]

当我尝试合奏方法

时

# shuffle and split the data into three parts
set.seed(1234)
finaltrain <- finaltrain[sample(nrow(finaltrain)),]
split <- floor(nrow(finaltrain)/3)
ensembleData <- finaltrain[0:split,]
blenderData <- finaltrain[(split+1):(split*2),]
testingData <- finaltrain[(split*2+1):nrow(finaltrain),]

我的问题是结识我在做什么不同？我是初学者，帮助我理解这一点。

培训数据集与模型相似，用于训练模型的数据集(在神经网络的情况下，权重也有偏差(然后是这些数据的学习模型。

通常，如果您使用的编程语言是Python，则培训数据集插入.CSV或.TXT格式。您还可以使用数据集使用表单矩阵，但编码的更改应一一更改。

验证数据集用于无偏评估训练数据集上合适模型的样本数据。设置验证用于评估给定模型。

测试数据集通常使用哪些测试集评估竞争模型。例如，例如在Kaggle竞赛中确定获胜者，验证集与训练集同时发布，并且测试集实际上只有在比赛结束时才会发布。这就是测试集中模型的结果，以决定获胜者。//测试集通常填充了涵盖模型将遇到的各种类的精心收集的数据。

相关内容

最新更新

热门标签：