我正在使用logistic回归和scikit中的线性SVC学习将文档分类为2个类别,该类别由标签0和标签1表示,我正在使用tfidf vectorizer进行功能选择,我已经提取了使用TFIDF vectorizer的转换功能,来自测试文档的所有非零功能在其上,现在我想知道是否将特定功能用于标签1或标签0。
基本上我想知道我的分类器是否给我作为标签0的答案,然后基于它给出了答案的功能。
您可以使用get_feature_names()
函数提取功能名称。您可以在这里阅读更多有关它的信息。
此示例说明了如何打印特征名称。
您可以从此链接中获取相应的相关值。跳过标题为:的部分,使TF-IDF矩阵有意义。您会看到使用feature_names()
来提取最高值。
编辑:不同的分类器有不同的方法来提取功能相关性。您可以在Sklearn中使用SelectFromomeel根据所选的分类器提取功能。您可以使用其get_support
函数来获取功能索引。这是相同的示例。