如何使用python过滤.xml文件中的特定值?



我对python编程有点陌生,正在寻找一些帮助,以便从.xml文件中过滤出一些值并将它们存储在DB中。下面是样例.xml文件。

<real:test="56348364" Id="test_1">
<rex:test>
<real:cut build_id="kusfjfkjhlkg-8348753984-kdjf-84kf94-ftteh"/>
</real:test>

根据上面的。xml,我需要过滤build_id值如下,

build_id="kusfjfkjhlkg-8348753984-kdjf-84kf94-ftteh"

如何过滤?

任何帮助都将是非常感激的。

谢谢。

这不是有效的XML。BeautifulSoup可以处理这种错误的语法,这是一件好事。

from bs4 import BeautifulSoup
data = '''
<real:test="56348364" Id="test_1">
<rex:test>
<real:cut build_id="kusfjfkjhlkg-8348753984-kdjf-84kf94-ftteh"/>
</real:test>
'''
soup = BeautifulSoup(data, 'html.parser')
# find by tag name
for e in soup.find_all('real:cut'):
print(e['build_id'])
# find any element with a build_id attribute
for e in soup.find_all('real:cut', {'build_id': True}):
print(e.name, e['build_id'])

最新更新