scikit-learn数据集中的标签输入是否有任何通用格式?我看到它有 target_names
中输出的标签列表.我想遵循scikit约定,并在输入变量中保留一些有关标签的数据(例如性别)。这有什么约定吗?像这样的东西
>>> data_set.inputs["sex"]
{'male': 1, 'female': 0}
没有用于存储分类特征名称信息的约定。您可以自由地做您想做的事。
或者,您可以只使用原始格式存储原始数据,并在需要从数据构建模型时即时使用DictVectorizer/FeatureHasher和LabelBinarizer。