我已经训练了一个 xgb 模型并在测试数据集上调用了一个预测函数
xg_reg.fit(X_train, y_train)
preds = xg_reg.predict(X_test)
但是,生成的preds
变量是一个numpy
数组,其中索引被重置为0-101
由于我的y_test
是一个熊猫数据帧,其中包含随机train_test_split from (sklearn.model_selection)
索引,因此我实际上无法将生成的预测值映射或附加到测试数据帧。
有没有办法在预测数组中保留原始索引?
取y_test.values()
并直接将它们与 preds 进行比较,将两者视为 numpy 数组并进行比较,预测肯定会与实际数据一致,索引在这种情况下并没有真正定义任何东西,如果您认为由于准确性低而导致 preds 和 y_test 之间存在不匹配,那肯定是模型或数据或其他方面的错误,但预测与y_test匹配