利用scikit获取信息.学习Python



我有这个问题,因为我正在使用scikit研究决策树。学习Python。我想为我的决策树的选定深度获得更好的叶子。

clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)

所以这是我的决策树函数,我的目标是选择正确的信息增益阈值来获得更好的结果。默认信息增益阈值为零,因此选择信息增益>为零的特征。

我想将信息增益阈值固定为优于特定数字。

就我对你的问题的理解,这是不支持的。在寻找分割时,不能为杂质的减少设置一个下界。即使改进接近于0,也总是选择减小量最大的那个。

最新更新