小贝子编程

过滤词性 NLTK 的特定部分

本文关键字：定部词性 NLTK 过滤 python filter nltk pos-tagger
更新时间 : 2023-09-06
英文 : Filter Specific Part of Speech NLTK

这必须很简单，但我不知何故错过了它。我有代码：

import nltk
f=open('...\t.txt','rU')
raw=f.read()
tokens = nltk.word_tokenize(raw)
print nltk.pos_tag(tokens)

例如返回：

"[（'进程'， 'NNS'），（'a'， 'DT'），（'序列'， 'NN'），（'

的'， 'IN'），（'words'， 'NNS'）]

我

想知道我怎么能只收集所有"NN"，例如所有"DT"和"IN"，而不是字符串的每个成员。

提前致谢

您可以使用列表推导式仅提取所需的标签，例如：

>>> tags = nltk.pos_tag(tokens)
>>> dt_tags = [t for t in tags if t[1] == "DT"]
>>> dt_tags
[('a', 'DT')]

最新更新

Mongodb中的嵌套分组
在Get-WmiObject表中连接字符串到整数- PowerShell
多节表单的最佳实践
SMS - Android -来自交易的商家名称
如何从HTTP服务器停止日志记录
Java:通过TCP发送/接收数据，从UDP接收图像
如何在xcode开放开发工具中更改默认模拟器
地形属性"路线"的值不合适
过滤包含动态数据的多列
UseMethod("docvars") 中的错误：没有适用于类 "c('corpus'， 'character')"对象的 'docvars' 方法。
如何在docker中使用mongo import导入多个不同的集合
如何在GPA计算器中构建for循环?Java
TypeError: getiitems [props. properties].(动作)不是函数
通过脚本(Bash)执行时未加载模块
如何在Python/pandas中绑定(concat) 3个数据帧
Common LISP中多维数组的洗牌
javascript拖放，而不是显示图像信息
如何删除字母之间额外的空白字符?
在行为列表的数据框中过滤行
使用无服务器基础设施从套接字捕获数据
在react js中将json渲染为表
如何在gitlab ci中定义动态分支
如何制作一个记录事件的discord.py bot ?
Laravel对重复数据的集合求和
如何将具有相同类的多个元素更改为数组项列表
我将一个字符串转换为float，如何验证它是f64
如果pandas数据框架的一个单元格包含所有大写字符串的列表，则从该数据框架中删除一行
如何按开始时间和结束时间对日期数组进行分组，并减去最后一个值-第一个值
在页面中间改变滚动方向，然后返回
JavaScript如何for循环不同的元素作为一个变量在相同的函数中应用

过滤词性 NLTK 的特定部分

相关内容

最新更新

热门标签：