我已经用nltk.download()
命令下载了NLTK的所有包。但问题是,当我试图导入TweetTokenizer
时,我得到了错误。
tokenizer = TweetTokenizer(preserve_case=False, strip_handles=True, reduce_len=True)
tweet_tokens = tokenizer.tokenize(tweet2)
错误:
NameError: name 'TweetTokenizer' is not defined
nltk.download()
不是用于导入包,而是用于下载相应的语料库和模块。
您仍然需要导入模块。为此,您必须使用from nltk.tokenize import TweetTokenizer
。
您可能还没有导入TweetTokenizer
。试一试:
from nltk.tokenize import TweetTokenizer