Python 如何获取没有标签 xml 的标签值


  • 我正在使用findAllBeautifulSoup方法并尝试获取特定标签DocumentIndex的所有值。
  • 使用它时,我得到的输出为
[<DocumentIndex>3646</DocumentIndex>, <DocumentIndex>3650</DocumentIndex>, <DocumentIndex>3649</DocumentIndex>]
  • 代码,gstr_xml可在此处获得
lstr_soup = BeautifulSoup(gstr_xml, features="xml")
lstr_folder_index = lstr_soup.findAll('DocumentIndex')
print(lstr_folder_index)
  • 我怎样才能获得输出
[3646, 3650, 3649]

列表中的每个值都是一个<class 'bs4.element.Tag'>,您可以调用.text来检索文本值。

print([x.text for x in lstr_folder_index])
# Output:
['3646', '3650', '3649']