Scikit-learn DictVectorizer to Classifier

我正在尝试加载字典，然后执行分类。但是，我收到错误：

  File "train_classifier.py", line 49, in <module>
    clf.fit(page_vecs.data[:-1],page_vecs.target[:-1])
  File "/usr/local/lib/python3.4/site-packages/scipy/sparse/base.py", line 505, in __getattr__
    raise AttributeError(attr + " not found")
AttributeError: target not found

如何加载目标？这是我的代码：

vec = DictVectorizer()
page_vecs = vec.fit_transform(feature_dict_list)
clf = svm.SVC(gamma=0.001, C=100)
clf.fit(page_vecs.data[:-1],page_vecs.target[:-1])
print(clf.predict(page_vecs[-1]))

看看 DictVectorizer 类，特别是它的fit_transform方法：

返回：
Xa ： {array， sparse matrix}

特征向量;始终为 2-d。

所以它返回一个 2D 数组。

在您的代码中，此行：

page_vecs = vec.fit_transform（feature_dict_list）

将导致page_vecs成为这样的 2D 数组。 2D numpy 数组没有 target 属性，您尝试在此处使用：

clf.fit（page_vecs.data[：-1]，page_vecs.target[：-1]）

这就是您收到错误的原因。事实上，你甚至不应该做.data，你应该直接使用 numpy 数组。如果要忽略最后一行，请执行以下操作：

page_vecs[:-1, :]

您的标签（或目标）与DictVectorizer类无关，该类仅矢量化样本，而不矢量化标签。您应该为标签提供一个单独的向量。

相关内容

最新更新

热门标签：