关于如何避免类型不匹配,有什么建议吗



我从网上读取HTML文件,并试图解析文本

>>> import nltk
>>> import urllib3
>>> http = urllib3.PoolManager()
>>> r = http.request('GET', 'http://www.gutenberg.org/files/2554/2554.txt')
>>> r.status
404
>>> tokens = nltk.word_tokenize(r.data)
TypeError: cannot use a string pattern on a bytes-like object

类型不匹配似乎正在发生,但我不知道解决方案。

Python"TypeError:不能在类似字节的对象"上使用字符串模式;当我们尝试使用字符串模式来匹配字节对象时,就会发生这种情况。要解决错误,请使用decode((方法。

为了更清晰,您可以查看此链接:https://bobbyhadz.com/blog/python-cannot-use-a-string-pattern-on-bytes-like-object#:~:text=%20Python%20%22TypeError%3A%20不能%20使用,%27utf%2D8%27(%20。

最新更新