我有一个python机器学习脚本,它从防火墙日志数据中学习。我正在使用随机森林分类器。如果我将其作为服务运行,则可以每天在收到最后一天的防火墙日志时一次又一次地训练模型。
这些是 sklearn 中的估计器,它们支持您想要做的事情,不幸的是,随机森林不是其中之一,因此每次添加数据时都必须重新调整。
如果您坚持使用随机森林,一种选择是减少特征的数量(基于您当前拥有的分类器(以提高重新拟合分类器的速度。
我有一个python机器学习脚本,它从防火墙日志数据中学习。我正在使用随机森林分类器。如果我将其作为服务运行,则可以每天在收到最后一天的防火墙日志时一次又一次地训练模型。
这些是 sklearn 中的估计器,它们支持您想要做的事情,不幸的是,随机森林不是其中之一,因此每次添加数据时都必须重新调整。
如果您坚持使用随机森林,一种选择是减少特征的数量(基于您当前拥有的分类器(以提高重新拟合分类器的速度。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium