重用功能拆分回归决策树的节点



在我观看的一段关于回归树算法的视频结束时,我留下了一个小问题:当数据集的某个特征具有残差平方和值较低的阈值时,它用于分割节点(如果节点中的观测数大于某个预定义值(。但是,这个相同的功能可以再次用于拆分该树分支的节点吗?或者,该分支的以下分割必须由其他特征定义的阈值分割(即使已经分割其他节点的特征具有该节点的观测值的残差平方和的较低值的阈值(?

此外,在研究决策树分类器时,我也有同样的疑问:如果一个已经在这个分支中使用的特征可以用比其他特征更低的gini杂质值来分割某个节点的观测值,那么这就是";已使用";是否允许执行拆分的功能?

提前感谢您的关注!

记住哪些数据与树中的任何节点关联很重要。假设我在特征x1上分割我的根节点,其中左子节点的x1=0,右子节点的x1=1。然后左子树中的所有都将具有x1=0。在x1上拆分已经没有意义了——所有数据都有相同的x1值!

如果x1是连续变量,根节点可以拆分如下:x1<0表示左边的子项,并且x1>0表示正确的子项。因此,在x1上拆分下一个节点(比如说右边的子节点(仍然很有意义。例如:x1<10和x1>10.关于第一条件的样本将对应于具有在0和10之间的x1的样本!希望它能帮助你:(

最新更新