我有三个数据集:训练、验证、测试,我目前正在使用 XGBoost 分类器来完成分类任务的工作。
我在火车集上训练了XGBClassifier,并将其保存为泡菜文件,以避免每次都重新训练它。从 pickle 文件加载模型后,我可以使用其中的预测方法,但我似乎无法在验证集或任何其他新数据集上训练此模型。
注意:我没有收到任何错误输出,jupyter 实验室单元看起来工作正常,但我的 CPU 内核在此单元运行期间都处于休息状态,因此我看到模型未安装。
这可能是 XGBoost 的问题,或者泡菜倾倒模型在加载后无法再次安装吗?
一年前我有完全相同的问题,你可以在这里找到问题和答案
但是,通过这种方式,您将使用新数据继续向现有模型添加"树"(助推器(。
最好在训练 + 验证数据集上训练新模型。
无论您决定做什么,都应该尝试这两个选项并评估您的结果,看看哪个更适合您的数据。