分层KFold与train_test_split分层之间的区别



在训练我的模型时,当我使用类似 sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)sklearn.model_selection.StratifiedKFold(n_splits=10),想知道他们如何分层数据之间是否存在差异。我几乎可以肯定我根据文档实现了所有内容,但奇怪的是,后者的测试准确性比第一个差得多。

stratify不是 None 时train_test_split内部使用 StratifiedShuffleSplit,而不是 StratifiedKFold。所以是的,有很大的不同。

最新更新