从旧的BeautifulSoup格式转换为新的格式



我发现了一个较旧的Python代码,其中有以下行:

    return BeautifulSoup(m.group(1),
            convertEntities=BeautifulSoup.HTML_ENTITIES).contents[0].string

当我尝试运行代码时,我得到了这个错误:

AttributeError: type object 'BeautifulSoup' has no attribute 'HTML_ENTITIES

有人能解释一下这条线的含义吗

BeautifulSoup(m.group(1),convertEntities=BeautifulSoup.HTML_ENTITIES).contents[0].string

在使用格式化程序的新版本中,如何做到这一点?

我知道这里已经回答了一个类似的问题:BeautifulSoup';没有属性';HTML_实体但由于我不熟悉BeautifulSoup,我无法将该行转换为新格式。

非常感谢在这方面的任何帮助。

这里根本不需要指定convertEntities,这种行为(将HTML实体转换为其Unicode代码点)现在是默认

最新更新