小贝子编程

使用 sklearn 使用数字变量和分类变量来拟合决策树

本文关键字：类变量拟合决策树变量 sklearn 数字使用 scikit-learn decision-tree categorical-data one-hot-encoding
更新时间 : 2023-09-08
英文 : Using both numeric and categorical variables to fit a decision tree using sklearn

在sklearn中使用onehotencode对分类变量使用onehotencode时，如何使用稀疏矩阵生成与其他数值变量来拟合决策树？如果我使用 OneHotEncoding 将分类变量转换为稀疏矩阵，那么如何将该稀疏矩阵与原始数据集中的数值变量组合在一起？

使用：

OneHotEncoder 带有参数categorical_features索引您的特征进行编码(自动组合您的所有特征)
- 默认情况下，如果未更改sparse=True，则结果为稀疏(使用transform)
或者：当仅在变量子集上使用OneHotEncoder时，将这些值堆叠到原始值上：
- scipy.sparse.hstack((onehot, original))
- 其中onehot的形状为(n_samples, ?(取决于您的特征)，original的形状为(n_samples, ?

相关内容

没有找到相关文章

最新更新