如何重新应用collocation_list()到我的数据?



我花了几个小时试图在我的数据中获得识别搭配。当我运行NLTK示例

text4.collocation_list()

…它的工作原理。但是,当我直接尝试将其应用于我自己的数据时,我得到以下错误消息:

Traceback(最近一次调用):文件"<pyshell#95>&quotTokens.collocation_list ()AttributeError: 'list'对象没有属性'collocation_list'

这是我的脚本:

File1 = open("/Applications/Python 3.9/StormZuluStory.txt",encoding="Latin-1")
StormZuluStory=File1.read()
File2 = open("/Applications/Python 3.9/StormZuluPOSStory.txt",encoding="Latin-1")
StormZuluPOSStory=File2.read()
#print (StormZuluStory)
#print (StormZuluPOSStory)
import nltk
nltk.download()
from nltk.book import *
from nltk import word_tokenize
Tokens = word_tokenize(StormZuluStory)
StormZuluStory.split()
fdist = FreqDist(Tokens)
#print(fdist)
Freq1 = fdist.most_common(30)
print (Freq1)
Plot1 = fdist.plot(30,cumulative=True)
Tokens.collocation_list()

问题是word_tokenize返回list(通过findall),而list没有collocation_list方法外观。
您可能想使用另一个函数,该函数应该返回具有collocation_list方法的Tokens

最新更新