这是我的问题,我有一个巨大的火车集,所以我无法将其加载到内存中并应用此代码。
model = LogisticRegression()
model = model.fit(train_set_df, y_label_df)
因此,我正在寻找一种方法来训练我的 Sklearn.LogisticRegression 模型,方法是逐个传递实例,以避免将所有训练数据加载到内存中。谢谢
您正在寻找partial_fit
方法。 LogisticRegression
不支持它。您可以使用MultinomialNB
(或任何其他朴素贝叶斯)或SGDClassifier
。