我想知道我在h2o R版本中的随机森林拟合的袋内训练指标:
rf_cv = h2o.randomForest(x = x, y = y,
training_frame = cali,
ntrees = 800,
nfolds = 5,
mtries = 3,
seed = 98)
当我打印得分历史记录时,我会得到以下训练指标:
> rf_cv@model$scoring_history
number_of_trees training_rmse training_mae training_deviance
1 0.70767 0.45476 0.50080
...
800 0.47283 0.30862 0.22357
但这些指标来自开箱样品,如性能摘要所示:
> h2o.performance(rf_cv)
H2ORegressionMetrics: drf
** Reported on training data. **
** Metrics reported on Out-Of-Bag training samples **
MSE: 0.2235729
RMSE: 0.4728349
MAE: 0.3086151
RMSLE: 0.1403068
Mean Residual Deviance : 0.2235729
我知道我可以用h2o.performance(rf_cv, data = train)
获得整体的袋内训练表现,但我需要得分历史。我浏览了文档并寻找了类似的问题,但到目前为止我什么也没找到。如有任何帮助,我们将不胜感激。
不是专家,但我花了一些时间,也做了一些研究,据我所知,没有办法检索包内分数。对于一个随机的森林来说,计算它是没有意义的。我也没有发现任何与袋外或袋内样品有关的东西,所以我认为它们也没有被储存起来。然而,如果你能在某个地方找到它们,你可能会使用h2o.getModelTree()
来产生某种分数。
你也可以去查看源代码,看看你是否有更深入的见解。
我还发现了这个问题,它可能会对你有所帮助。但是,它不使用h2o
,而是使用randomForest
R库(如果您可以选择的话(。在那里,你可以检索OOB样本,这样你就知道袋子里的样本是什么,然后你可以自己打分,但我自己没有这样做。