NLTK POS标签:如何将"Word"及其相应的"POS标签"放入数据帧中



我有一个列表,比如list = ['about','above','account','address','after']我将其传递给NLTK POS 标签函数,输出以列表的形式如下所示:

[('about', 'IN'),('above', 'JJ'),('account', 'NN'),('address', 'NN'),('after', 'IN')]

现在我需要以数据帧的形式分别显示这些单词和 POS 标签,因此输出如下所示:

Words   Pos Tags
about     IN
above     JJ
account   NN
address   NN
after     IN

这应该很容易:

In [15]: data = [('about', 'IN'),('above', 'JJ'),('account', 'NN'),('address', 'NN'),('after', 'IN')]
In [16]: df = pd.DataFrame(data, columns=['Word', 'POS'])
In [17]: df
Out[17]:
Word POS
0    about  IN
1    above  JJ
2  account  NN
3  address  NN
4    after  IN

最新更新