如何手动选择决策树的功能

我需要能够更改用于构建决策树的特征(具有机器学习含义(。给定鸢尾花数据集的示例，我希望能够选择萼片长度作为根节点中使用的特征，选择花瓣长度作为第一级节点中使用的特征，依此类推。

我想明确一点，我的目的不是改变最小样本拆分和决策树的随机状态。而是选择特征 - 分类元素的特征 - 并将它们放在决策树的某些节点中。

然后，代码应该能够找到最佳阈值 - 每个节点的范围 - 以生成最佳拆分。

这里有一些关于树生成的一般代码。

from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
clf = DecisionTreeClassifier(random_state=0)
iris = load_iris()
clf.fit(iris.data,iris.target)

你们中有人做过吗？

你们中有人这样做过吗？

不，你可能是第一个！

哈哈，但是您可以通过多种方式选择它，也可以在官方文档中找到它：https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html

# import some data to play with
iris = datasets.load_iris()
X = iris.data[:, :2]  # we only take the first two features.
y = iris.target

那么你正在做：clf.fit(X, y)

下面介绍了执行此操作的方法：在熊猫数据帧中选择多个列

相关内容

最新更新

热门标签：