我的模型 随机森林的调用是:
Call:
randomForest(formula = medv ~ ., data = training_set, ntree = 100, set.seed = 500)
Type of random forest: regression
Number of trees: 100
No. of variables tried at each split: 4
Mean of squared residuals: 0.1200638
% Var explained: 87.96
我们如何解释所有这些数字? 关于否的任何建议。 每次拆分时尝试的变量数? 我应该增加它吗?
Mean of squared residuals: 0.1200638
% Var explained: 87.96
我们如何解释这两者?更低,更高?哪个更好?
谢谢!
您是在谈论您提到的两个评估指标吗?
残差平方的均值 - 越低越好,因为它是误差平方的均值(残差(
Var 解释说 - 越高越好,因为它variance of predicted values / variance of actual values
让我知道上述内容是否解决了您的问题,或者您需要进一步澄清指标。