我已经在R Studio中安装了插入符号包。我使用这个包来拆分数据,并最终将其放入模型中。数据代码的分割如下:-
library(caret)
set.seed(1234)
trainIndex<- CreateDataPartition(y, times = 1, p = 0.5, list = F)
Training<- dataset[trainIndex,]
Validation<- dataset[-trainIndex,]
将50%的数据分成训练集和测试集。但是当我使用glm()
命令在模型中拟合数据时,它将100%的数据用于训练。
glm(y~ dataset$x1 + dataset$x2 + dataset$x3, family = binomial(link = "logit"), data = Training)
我不知道出了什么问题。
使用data = ...
参数时,最好不要在模型中使用$
。模型使用dataset$x...
,所以它取100%的数据。
glm(y~ x1 + x2 + x3, family = binomial(link = "logit"), data = Training)