dataset=['apple','orange','banana','grape','orange','apple','kiwi','apple']
所以数据集的特征类型是类别,但我应该如何编码来识别数据集中的特征值?
命令:print('The feature values of The dataset:',我应该在这里输入什么?)
输出:数据集的特征值:"苹果"、"橙子"、"香蕉"、"葡萄"、"猕猴桃">
使用python集
dataset={'apple','orange','banana','grape','orange','apple','kiwi','apple'}
集合强制值是唯一的。如果要维护原始列表,可以将其转换为
的集合。data = ['apple','orange','banana','grape','orange','apple','kiwi','apple']
dataset = set(data)
print(dataset)
#returns {'banana', 'apple', 'kiwi', 'grape', 'orange'}