部署时 h2o MOJO 与 POJO 之间的性能差异



我用h2o.GLM训练了一个二元分类器模型。我有大约 5-10 个功能。我想知道哪个在生产中会更快?

  1. 在我的 java 代码中对逻辑回归进行编码。
  2. 通过 h2o 使用 POJO
  3. 使用 h2o 生成的 MOJO。

如果我训练随机森林模型而不是 GLM,这个答案会改变吗?

我需要得分~1亿行。我已经在分发不同观察结果的评分。

对于逻辑回归,POJO 或 MOJO 都可以。 首选 MOJO 以获得更好的向后兼容性属性。

对于深度超过6的随机森林,一定要使用MOJO。 非常大(例如 1 GB 或更多)的 RF 模型甚至无法编译。

MOJO不需要编译,这非常方便,对于非常深的树,它们运行得更快,运行时间非常一致。

最新更新