有没有办法根据scikit中的Tfidfvectorizer输出选择前100或1000个单词袋



我正在尝试根据Python的scikit-learn库的tfidfVectorizer输出找到前100/1000个单词。有没有办法使用 scikit 库中的函数来做到这一点?

感谢您的帮助

前 100/1000 个单词是什么意思?数据集中最常用的单词?您可以使用 Python 标准库的 Counter 类来执行此操作。无需学习。

相关内容

  • 没有找到相关文章

最新更新