示例:我的数据不适合内存,我可以做什么:
model=my_model
for i in range(20)
model.fit(X_i,Y_i)
这将删除前19次拟合。只保留最后一个。我该如何避免这种情况?我可以重新培训保存和加载的模型吗?感谢
一些模型有一个"warm_start"参数,它将使用fit()的先前解决方案初始化模型参数
例如,请参阅SGD分类器
您需要阅读6.1.3。从sklearn文档中进行增量学习http://scikit-learn.org/0.15/modules/scaling_strategies.html
一种选择是首先减少数据,提取数据的子集,或者在数据库的帮助下减少数据的维度。这将大大减少您的数据量。
您可能希望从随机选择的数据子集中创建多个模型,然后比较这些模型,并使用产生最高精度的最佳模型。