哪些对象类型可用于决策树中的特征?是否需要将"object"类型转换为其他类型?



我使用熊猫导入了一个表,我能够设置自变量(特征(和我的因变量(目标(。我的两个自变量是"对象类型",另一个是int64和float64。我是否需要将"对象"类型特征转换为"类"或其他类型?如何在 Sci-kit 学习决策树中处理这些问题?

基于文档 (https://scikit-learn.org/stable/modules/tree.html(:

能够处理数字和分类数据。其他技术 通常专门分析只有一种类型的数据集 的变量。有关详细信息,请参阅算法。

因此,您可以使用对象类型以及int64和float64运行它。这是决策树的好处之一,它也可以处理非数字数据。

我使用one hot encoding来转换我的分类数据,因为scikit-learn decision tree包不支持分类数据。

最新更新