我有一个CSV文件,其中包含来自truecar.com的汽车信息,我想用这个数据预测汽车的价格,但我得到一个错误。下面是回溯:
File "xPython39libsite-packagesnumpycore_asarray.py", line 102, in asarray
return array(a, dtype, copy=False, order=order)
ValueError: could not convert string to float: 'exterior_color'
代码:
import csv
from sklearn import tree
x = []
y = []
with open('x', 'r') as csv_file:
data = csv.reader(csv_file)
for line in data:
x.append(line[0:-2])
y.append(line[-1])
# print(x)
# print(y)
clf = tree.DecisionTreeClassifier()
clf = clf.fit(x, y)
DecisionTreeClassifier
的fit
方法在其X
参数(文档)中接受浮点数数组。
我建议你不要编码你的非数字变量。我建议您阅读一些关于此方法的文章,该方法将一列分类数据转换为多列布尔值。
将分类数据传递给Sklearn决策树
为什么在机器学习中要对数据进行One-Hot编码?