(如何)在sklearn中使用fit对模型进行两次(多次)训练



示例:我的数据不适合内存,我可以做什么:

model=my_model
for i in range(20)
       model.fit(X_i,Y_i)

这将删除前19次拟合。只保留最后一个。我该如何避免这种情况?我可以重新培训保存和加载的模型吗?感谢

一些模型有一个"warm_start"参数,它将使用fit()的先前解决方案初始化模型参数

例如,请参阅SGD分类器

您需要阅读6.1.3。从sklearn文档中进行增量学习http://scikit-learn.org/0.15/modules/scaling_strategies.html

一种选择是首先减少数据,提取数据的子集,或者在数据库的帮助下减少数据的维度。这将大大减少您的数据量。

您可能希望从随机选择的数据子集中创建多个模型,然后比较这些模型,并使用产生最高精度的最佳模型。

相关内容

  • 没有找到相关文章

最新更新