我在这里读了几个关于h2o.predict((和h2o.performance((差异的线程(如下面的链接所示(。
如何解释h2o.predict((结果的概率(p0,p1(
有人能告诉我h2o.predict((使用哪个阈值吗?是max f1
吗?如果是,它是来自训练数据、验证数据还是交叉验证的阈值?
我试图在测试集上使用max f1
和max f0point5
来使用验证阈值(与训练和验证数据完全分离(,但来自h2o.predict((的预测类和来自使用阈值的类并不完全匹配。
我得到的最接近的一个是使用训练中的max f0point5
阈值,并将其应用于测试集。
关于h2o.predict的文档不多。此外,是否有阈值的最佳实践,即验证和培训的平均阈值等?
提前感谢!
以下是用户运行h2o.predict()
或.predict()
:时如何选择预测阈值的细节
1( 如果只使用训练数据训练模型,则使用训练数据模型度量中的最大F1阈值。
2( 如果使用训练和验证数据训练模型,则使用验证数据模型度量中的最大F1阈值。
3( 如果使用列车数据训练模型并设置nfold参数,则使用列车数据模型度量中的最大F1阈值。
4( 如果使用训练数据、验证数据训练模型并设置nfold参数,则使用验证数据模型度量中的最大F1阈值。