我已经创建了我的模型POJO,当使用Hive UDF生成预测时,我必须用相同的数据类型保持列的顺序?忽略额外列并添加列的最干净方法是什么?这些列存在于训练数据集中,但不存在于测试数据集中,我的所有列要么是双列,要么是长列。
如果您使用Easy包装器,它会自动为您执行此操作。
如果你没有使用Easy包装器,那么你需要发明同样的行为。
使用Easy包装器,将忽略新列,并将丢失的列视为N/A。
我已经创建了我的模型POJO,当使用Hive UDF生成预测时,我必须用相同的数据类型保持列的顺序?忽略额外列并添加列的最干净方法是什么?这些列存在于训练数据集中,但不存在于测试数据集中,我的所有列要么是双列,要么是长列。
如果您使用Easy包装器,它会自动为您执行此操作。
如果你没有使用Easy包装器,那么你需要发明同样的行为。
使用Easy包装器,将忽略新列,并将丢失的列视为N/A。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium