小贝子编程

有没有办法根据scikit中的Tfidfvectorizer输出选择前100或1000个单词袋

本文关键字：选择单词袋 1000个输出 Tfidfvectorizer 中的 scikit 有没有 python scikit-learn scikits
更新时间 : 2023-08-30
英文 : Is there a way to select top 100 or 1000 bag of words based on Tfidfvectorizer output in scikit

我正在尝试根据Python的scikit-learn库的tfidfVectorizer输出找到前100/1000个单词。有没有办法使用 scikit 库中的函数来做到这一点？

感谢您的帮助

前 100/1000 个单词是什么意思？数据集中最常用的单词？您可以使用 Python 标准库的 Counter 类来执行此操作。无需学习。

最新更新