如何手动选择决策树的功能



我需要能够更改用于构建决策树的特征(具有机器学习含义(。给定鸢尾花数据集的示例,我希望能够选择萼片长度作为根节点中使用的特征,选择花瓣长度作为第一级节点中使用的特征,依此类推。

我想明确一点,我的目的不是改变最小样本拆分和决策树的随机状态。而是选择特征 - 分类元素的特征 - 并将它们放在决策树的某些节点中。

然后,代码应该能够找到最佳阈值 - 每个节点的范围 - 以生成最佳拆分。

这里有一些关于树生成的一般代码。

from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
clf = DecisionTreeClassifier(random_state=0)
iris = load_iris()
clf.fit(iris.data,iris.target)

你们中有人做过吗?

你们中有人这样做过吗?

不,你可能是第一个!

哈哈,但是您可以通过多种方式选择它,也可以在官方文档中找到它:https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html

# import some data to play with
iris = datasets.load_iris()
X = iris.data[:, :2]  # we only take the first two features.
y = iris.target

那么你正在做:clf.fit(X, y)

下面介绍了执行此操作的方法:在熊猫数据帧中选择多个列

最新更新