如何调整R中的包装参数



我想知道我们何时使用袋子进行分类,可以调整哪些参数,我们可以使用交叉验证来调整它?

在R中的装袋功能中,它说我们可以使用Nbagg来更改引导复制的数量。并使用rpart.control。

这是我的代码 bagging(income ~., data = training3, coob= T)

何时在分类中使用包装?

包装本质上是从单个训练组中进行重复的样本,以生成X数量的不同自举训练数据集。然后,我们将方法训练在这些训练集上,并在回归的情况下平均所有预测,我们在分类时使用投票。包装有助于减少结果的差异,因此,如果您经常选择包装的结果有很高的差异,则通常会胜过随机森林并提高行李。

可以调整哪些参数,我们可以使用交叉验证来调整它?

nbagg: nbagg参数用于控制决策树的数量投票在集合中(默认值为25)。根据学习任务的难度和培训数据的数量,增加该数字可能会提高模型的性能,但会增加额外计算费用。

cp: CP是正确调整的修剪树时的复杂性参数,复杂性参数(CP)用于控制决策树的大小并选择最佳树大小。如果从当前节点向决策树添加另一个变量的成本高于CP的值,则树建筑物不会继续,您可以击中并试用它并查看适合您的内容。

我们可以使用交叉验证吗?

是的
library(caret)
set.seed(1729)
cntrl <- trainControl(method = "cv", number = 10)
train(dependent_variable ~ ., data = mydata, method = "treebag",
        trControl = cntrl)

最新更新