如何让我的 Python 机器学习模型继续学习,因为我每天向它提供更多数据



我有一个python机器学习脚本,它从防火墙日志数据中学习。我正在使用随机森林分类器。如果我将其作为服务运行,则可以每天在收到最后一天的防火墙日志时一次又一次地训练模型。

这些是 sklearn 中的估计器,它们支持您想要做的事情,不幸的是,随机森林不是其中之一,因此每次添加数据时都必须重新调整。

如果您坚持使用随机森林,一种选择是减少特征的数量(基于您当前拥有的分类器(以提高重新拟合分类器的速度。

相关内容

最新更新