在测试数据上使用h2o-pojo,该测试数据具有比训练的模型更多的列,有时还缺少训练数据集中的列



我已经创建了我的模型POJO,当使用Hive UDF生成预测时,我必须用相同的数据类型保持列的顺序?忽略额外列并添加列的最干净方法是什么?这些列存在于训练数据集中,但不存在于测试数据集中,我的所有列要么是双列,要么是长列。

如果您使用Easy包装器,它会自动为您执行此操作。

如果你没有使用Easy包装器,那么你需要发明同样的行为。

使用Easy包装器,将忽略新列,并将丢失的列视为N/A。

相关内容

  • 没有找到相关文章

最新更新