如何将.fit()与交叉验证一起使用



我对数据科学很陌生,有点困惑。我只是想确保我的方法是合理的。

我创建了如下模型:

lr7 = GaussianNB().fit(X_train,y_train)

然后使用cross_val_prdictive((。

y_pred8 = cross_val_predict(lr8, X_test, y_test, cv=5, n_jobs=-1, verbose=5)

首先交叉验证列车组不是更有意义吗?

scikitslearn中还有一个cross_validate()函数。将这个与火车数据集一起使用正确吗?在文档中,他们使用X和y表示两者,而不是训练/测试分离的数据。

实现交叉验证的一种简单方法是使用cross_val_score函数(来自sklearn。这可能适合您的问题。

# build model
lr7 = GaussianNB()
scores = cross_val_score(lr7, X, y, cv=5)

请注意,在交叉验证中,您可以使用整个数据集或训练部分X_trainy_train,但决不能使用代码中显示的测试部分。

相关内容

最新更新