r-有没有一种方法可以根据h2o.randomForest()中的袋内样本(而不是袋外样本)获得训练得分历史



我想知道我在h2o R版本中的随机森林拟合的袋内训练指标:

rf_cv = h2o.randomForest(x = x, y = y,
training_frame = cali,
ntrees = 800,
nfolds = 5,
mtries = 3,
seed = 98)

当我打印得分历史记录时,我会得到以下训练指标:

> rf_cv@model$scoring_history
number_of_trees training_rmse training_mae training_deviance
1               0.70767       0.45476      0.50080
...
800             0.47283       0.30862      0.22357

但这些指标来自开箱样品,如性能摘要所示:

> h2o.performance(rf_cv)
H2ORegressionMetrics: drf
** Reported on training data. **
** Metrics reported on Out-Of-Bag training samples **
MSE:  0.2235729
RMSE:  0.4728349
MAE:  0.3086151
RMSLE:  0.1403068
Mean Residual Deviance :  0.2235729

我知道我可以用h2o.performance(rf_cv, data = train)获得整体的袋内训练表现,但我需要得分历史。我浏览了文档并寻找了类似的问题,但到目前为止我什么也没找到。如有任何帮助,我们将不胜感激。

不是专家,但我花了一些时间,也做了一些研究,据我所知,没有办法检索包内分数。对于一个随机的森林来说,计算它是没有意义的。我也没有发现任何与袋外或袋内样品有关的东西,所以我认为它们也没有被储存起来。然而,如果你能在某个地方找到它们,你可能会使用h2o.getModelTree()来产生某种分数。

你也可以去查看源代码,看看你是否有更深入的见解。

我还发现了这个问题,它可能会对你有所帮助。但是,它不使用h2o,而是使用randomForestR库(如果您可以选择的话(。在那里,你可以检索OOB样本,这样你就知道袋子里的样本是什么,然后你可以自己打分,但我自己没有这样做。

最新更新