我使用Scikit learn train_test_split和随机森林进行建模。我已经在train_test_split random_state设置了固定数字,假设 random_state=1,但它仍然每次运行都会产生不同的结果。我想要一个固定的结果来比较模型。多谢。
"不同的结果"是什么意思? 我建议在将训练/测试集传递给训练代码之前尝试打印训练/测试集的简短预览。 例如:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 random_state = 1)
print(X_train[:10])
我可以确认此代码将在多次运行中生成完全相同的X_train集。
但是,如果您所说的"结果不同"是指训练误差不同,则可能需要确保也修复了随机森林分类器的随机种子。