在BeautifulSoup中调试退出代码139



我在Python程序中遇到了一个问题,我不知道如何调试。我的程序使用BeautifulSoup来一页接一页地解析,在某个时刻,它会随着退出代码139而终止,没有错误消息(即使通过调试器运行)。据我所知,139意味着分割错误,这并没有给我太多的线索。这个问题是不确定的,不会很快发生,所以很难重现。反复向BeautifulSoup提供相同的HTML并不会导致问题,即使我使用了我过去见过的导致问题的HTML。我能做些什么来调试这个问题吗?

这与美化组4中讨论的问题不同:分段故障(堆芯转储)。与我的问题不同,这个问题是确定性的,我在解析这个(现在有些过时)问题中讨论的网页时没有遇到任何问题。

将我使用的解析器切换到html.parser似乎解决了这个问题。

soup = BeautifulSoup(markup, "html.parser")

相关内容

最新更新