从文档中,
class sklearn.linear_model.SGDClassifier(class_weight=None)
与class_weight函数一样,如何为功能集的特定方面赋予权重?就像我的功能集由原始文本和一些名称组成一样。在训练时,我想给名字更多的权重,而给原始文本更少的权重。我该怎么做?
选项可以对SGDClassifier
中的功能进行权重,据我所知,scikit-learn中没有其他学习者。
通常,为特征赋予不同的权重是没有意义的。毕竟,你做机器学习是因为你想让计算机找出哪些特征更重要。如果名称比原始文本更重要,分类器将在内部弄清楚这一点。
现在,如果您仍然希望具有不同重要性的不同特征,则可以组合多个分类器:仅使用名称特征训练一个分类器,仅使用原始文本特征训练另一个分类器。然后通过取每个分类器输出的加权平均值来组合它们的输出。您可以为名称分类器赋予更高的权重,这将增加名称对组合输出的影响。