我有根据类别、"描述"one_answers"成分"进行预测的文本分类数据。我可以用python中的词袋来做分类,用scikit来做"描述"。但是我想用两个类别在单词包中进行预测,并赋予每个特征集权重X =描述+ 2*组件我该怎么做?
您可以为描述和商家训练单个分类器,并使用score = w1 * predictions + w2 * components.
获得最终分数
w1
和w2
的值应采用交叉验证。
或者,您可以通过组合训练数据集来训练单个多类分类器。
你现在有4个类:
- 既不是"预测"也不是"组件"
- "预测"而不是"组件"
- 不是"预测"而是"组件"
- "预测"one_answers"组件"
你可以照常训练