创建和调整分类器



我在Excel文件中有两个列。第1行具有确切的用户输入,并且第2行具有其原因。例如

ROW 1                                     ROW 2
money deducted                            cause 1
delivery is late                          cause 2
something here                            cause 48
payment problem                           cause 1
.                                         .
.                                         .

任务是实现一个分类器,下一次给出特定用户输入时,它可以将其分类为原因之一,即使分类器了解这些情况并预测未来的值。

我有一些有关分类的知识,但是我真的希望有一个想法,我可以使用一个VS REST分类器实现。

这是您可以使用Scikit-learn实现此分类器的方式。根据target_names的索引将所有训练句子传递给X_Train和相应的标签。

X_train = np.array(["money deducted",
                    "delivery is late",
                    "something here",
                    "payment problem"])
y_labels = [(1, ), (2, ), (3, ), (1, )]
y_train = MultiLabelBinarizer().fit_transform(y_labels)
target_names = ['cause1', 'cause2', 'cause48']
classifier = Pipeline([
    ('vectorizer', CountVectorizer()),
    ('tfidf', TfidfTransformer()),
    ('clf', OneVsRestClassifier(LinearSVC()))])
classifier.fit(X_train, y_train)

这就是培训分类器的全部,然后您可以轻松预测任何想要的东西。有关更多参考:http://scikit-learn.org/stable/modules/generated/sklearn.multiclass.onevsrestclassifier.html

然后拟合并将y_lables转换为二进制器:

mlb.fit_transform(y_labels)

然后预测如下:

mlb.inverse_transform(classifier.predict(X_test))

这将为您提供类标签,然后您可以将其作为索引将其传递给target_names。

希望它有帮助!

相关内容

  • 没有找到相关文章

最新更新