分类数据


dataset=['apple','orange','banana','grape','orange','apple','kiwi','apple']

所以数据集的特征类型是类别,但我应该如何编码来识别数据集中的特征值?

命令:print('The feature values of The dataset:',我应该在这里输入什么?)

输出:数据集的特征值:"苹果"、"橙子"、"香蕉"、"葡萄"、"猕猴桃">

使用python集

dataset={'apple','orange','banana','grape','orange','apple','kiwi','apple'}

集合强制值是唯一的。如果要维护原始列表,可以将其转换为

的集合。
data = ['apple','orange','banana','grape','orange','apple','kiwi','apple']
dataset = set(data)
print(dataset)
#returns {'banana', 'apple', 'kiwi', 'grape', 'orange'}

最新更新