如何应用欠采样数据平衡,设置参数



Im使用H2O库,我想应用欠采样数据平衡,设置参数0.8。我该怎么做?我写了这个命令:

from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)

但是CCD_ 1使用随机参数。我想把这个参数设为0.8。

我将感谢任何帮助。谢谢

您需要再提供一个参数:class_sampling_factors。假设有两个类,并且您想对第一个类进行不足采样,则使用:

cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])

class_sampling_factors必须是一个浮动列表。列表中的每个元素决定了每个类的采样因子。

最新更新