数据集中标签输入的scikit-learn约定



scikit-learn数据集中的标签输入是否有任何通用格式?我看到它有 target_names 中输出的标签列表.我想遵循scikit约定,并在输入变量中保留一些有关标签的数据(例如性别)。这有什么约定吗?像这样的东西

>>> data_set.inputs["sex"]
{'male': 1, 'female': 0}

没有用于存储分类特征名称信息的约定。您可以自由地做您想做的事。

或者,您可以只使用原始格式存储原始数据,并在需要从数据构建模型时即时使用DictVectorizer/FeatureHasher和LabelBinarizer。

相关内容

  • 没有找到相关文章

最新更新