如何在词包中组合多个特征集



我有根据类别、"描述"one_answers"成分"进行预测的文本分类数据。我可以用python中的词袋来做分类,用scikit来做"描述"。但是我想用两个类别在单词包中进行预测,并赋予每个特征集权重X =描述+ 2*组件我该怎么做?

您可以为描述和商家训练单个分类器,并使用score = w1 * predictions + w2 * components.获得最终分数

w1w2的值应采用交叉验证。

或者,您可以通过组合训练数据集来训练单个多类分类器。

你现在有4个类:

  1. 既不是"预测"也不是"组件"
  2. "预测"而不是"组件"
  3. 不是"预测"而是"组件"
  4. "预测"one_answers"组件"

你可以照常训练

相关内容

  • 没有找到相关文章

最新更新