在训练我的模型时,当我使用类似 sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)
与 sklearn.model_selection.StratifiedKFold(n_splits=10)
,想知道他们如何分层数据之间是否存在差异。我几乎可以肯定我根据文档实现了所有内容,但奇怪的是,后者的测试准确性比第一个差得多。
当stratify
不是 None 时train_test_split
内部使用 StratifiedShuffleSplit,而不是 StratifiedKFold。所以是的,有很大的不同。