分类数据

dataset=['apple','orange','banana','grape','orange','apple','kiwi','apple']

所以数据集的特征类型是类别，但我应该如何编码来识别数据集中的特征值?

命令:print('The feature values of The dataset:'，我应该在这里输入什么?)

输出:数据集的特征值:"苹果"、"橙子"、"香蕉"、"葡萄"、"猕猴桃">

使用python集

dataset={'apple','orange','banana','grape','orange','apple','kiwi','apple'}

集合强制值是唯一的。如果要维护原始列表，可以将其转换为

的集合。

data = ['apple','orange','banana','grape','orange','apple','kiwi','apple']
dataset = set(data)
print(dataset)
#returns {'banana', 'apple', 'kiwi', 'grape', 'orange'}

相关内容

最新更新

热门标签：