小贝子编程

我的函数remove_stopwords.删除单词中的每个停止词

本文关键字：单词中删除函数 remove stopwords python nltk
更新时间 : 2023-09-08
英文 : My function remove_stopwords. Removes every stopwords in a word

因此，我试图从文本文件中删除所有停止字。问题是，它在每个单词中删除每个单词。

def remove_stopwords(input):
    stop_words  = set(stopwords.words('english'))
    filtered_words = [word for word in input if not word in stop_words]
    return filtered_words
Sample Input: Damage from Typhoon Lando soars to P6B
Output: Dge fr Tphn Ln r  P6B

在删除停止单词之前，请输入您的str。

from nltk.corpus import stopwords
from nltk import word_tokenize
stoplist  = set(stopwords.words('english'))
def remove_stopwords(text):
    return [word for word in word_tokenize(text) if not word in stoplist]

最新更新

无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?
无法使用 conda env 导入 OCI 笔记本会话中的模型配置详细信息
c - while循环中VSC的分段错误
无法将url数据获取到模型类中
如何将DataGridTextColumn绑定到WinUI3中绑定的对象中的方法?
错误在cobol程序上打开VB文件来处理XML文件
while循环在python中没有爆发
yii2查询具有多个非和或的数据提供程序
Libgdx:渲染方法
Pycharm 错误：预期类型 [类名] 改为"str"
运行我的代码时出现错误:未知的自定义元素
在Selenium 4中使用Behat和Mink Selenium2驱动程序为Microsoft Edge浏览器运行测试
宽度未知的可变列数
我必须在.env文件中存储哨兵公钥吗?
Mongodb子文档没有自动生成对象id Typegoose/ mongoose
类型中构造函数的参数 0 需要找不到类型为"org.hibernate.SessionFactory"的 Bean
根据r中的日期和小时每隔15分钟聚合数据
如何解决关于Optuna存储的错误?
c语言中OO继承的混叠问题
launchWebAuthFlow窗口在chrome扩展关闭后保持打开
使用非初始结构变量作为参数调用函数不会产生警告
Pytorch - mat1和mat2形状不能相乘(3328x13和9216x4096)
我如何得到一个节点超时的内部id使用符号没有硬编码查找索引?
spring引导应用程序读取另一个jar的应用程序配置值吗?
如何在main.js中导入javascript库以在整个vue应用程序中获得全局可用性?
使段落出现，并使其在点击显示下一个段落时消失
GROUP_CONCAT(DISTINCT xxx)将连接值的顺序颠倒
r语言 - 循环遍历列表的列表

我的函数remove_stopwords.删除单词中的每个停止词

相关内容

最新更新

热门标签：