小贝子编程

Python Scikit learn - 不想使用 train_test_split 进行随机拆分

我使用Scikit learn train_test_split和随机森林进行建模。我已经在train_test_split random_state设置了固定数字，假设 random_state=1，但它仍然每次运行都会产生不同的结果。我想要一个固定的结果来比较模型。多谢。

"不同的结果"是什么意思？我建议在将训练/测试集传递给训练代码之前尝试打印训练/测试集的简短预览。例如：

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 random_state = 1)
print(X_train[:10])

我可以确认此代码将在多次运行中生成完全相同的X_train集。

但是，如果您所说的"结果不同"是指训练误差不同，则可能需要确保也修复了随机森林分类器的随机种子。

相关内容