我在h2o.ai中使用h20generalizedlineareestimator .
我计划使用交叉验证内置选项来获得交叉验证性能。在拟合模型之前,我执行一些转换(主要是缩放和转换),这些转换依赖于我要应用转换的数据。
理想情况下,这些转换应该是"训练有素的";只是对列车进行了设置,并对测试数据进行了应用。因此,原则上,在交叉验证期间也应该这样做:在每个交叉验证步骤中,转换应该在相关的训练数据上进行训练,并应用于测试数据。
是否有可能在H2O中这样做,而无需手动实现交叉验证循环?
感谢如果您使用H2O GLM,则不需要对数据进行任何缩放,因为您可以通过将normalize
设置为True来自动进行缩放。如果由于某种原因需要进行其他转换,则需要设置手动CV循环,但希望您可以使用内置缩放。