sklearn决策树-无法将字符串转换为浮点数

我有一个CSV文件，其中包含来自truecar.com的汽车信息，我想用这个数据预测汽车的价格，但我得到一个错误。下面是回溯:

File "xPython39libsite-packagesnumpycore_asarray.py", line 102, in asarray
return array(a, dtype, copy=False, order=order)
ValueError: could not convert string to float: 'exterior_color'

代码:

import csv
from sklearn import tree
x = [] 
y = [] 
with open('x', 'r') as csv_file:
data = csv.reader(csv_file)
for line in data:
x.append(line[0:-2])
y.append(line[-1])
# print(x)
# print(y)
clf = tree.DecisionTreeClassifier()
clf = clf.fit(x, y)

DecisionTreeClassifier的fit方法在其X参数(文档)中接受浮点数数组。

我建议你不要编码你的非数字变量。我建议您阅读一些关于此方法的文章，该方法将一列分类数据转换为多列布尔值。

将分类数据传递给Sklearn决策树

为什么在机器学习中要对数据进行One-Hot编码?

相关内容

最新更新

热门标签：