在Python中，如何引用包含连字符的XML标记

我试图使用BeautifulSoup来解析XML文件。其中一个元素中有连字符:distribution-code

如何访问?我试过:

soup.distribution-code
soup."distribution-code" (tried single quotes too)
soup.[distribution-code]

您可以使用常规Python语法通过属性引用访问非连字符元素，即 obj.name ，然而，使用该语法时-不是有效字符(Python将其视为"减号"操作符)，因此您不能通过该方法访问此类元素。

请使用soup.find()或soup.find_all():

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<thing><id>1234</id><distribution-code>555444333</distribution-code></thing>')
>>> soup.thing
<thing><id>1234</id><distribution-code>555444333</distribution-code></thing>
>>> soup.id
<id>1234</id>
>>> soup.distribution-code
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'code' is not defined
>>> soup.find('distribution-code')
<distribution-code>555444333</distribution-code>

或者，正如chepner的评论所指出的，您可以使用getattr()和setattr()来获取和设置包含连字符的属性。我认为soup.find()是访问这些元素的更常用的方法。

相关内容

最新更新

热门标签：