Im使用H2O库,我想应用欠采样数据平衡,设置参数0.8。我该怎么做?我写了这个命令:
from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)
但是CCD_ 1使用随机参数。我想把这个参数设为0.8。
我将感谢任何帮助。谢谢
您需要再提供一个参数:class_sampling_factors
。假设有两个类,并且您想对第一个类进行不足采样,则使用:
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])
class_sampling_factors
必须是一个浮动列表。列表中的每个元素决定了每个类的采样因子。