- 我正在使用
findAll
BeautifulSoup
方法并尝试获取特定标签DocumentIndex
的所有值。 - 使用它时,我得到的输出为
[<DocumentIndex>3646</DocumentIndex>, <DocumentIndex>3650</DocumentIndex>, <DocumentIndex>3649</DocumentIndex>]
- 代码,gstr_xml可在此处获得
lstr_soup = BeautifulSoup(gstr_xml, features="xml")
lstr_folder_index = lstr_soup.findAll('DocumentIndex')
print(lstr_folder_index)
- 我怎样才能获得输出
[3646, 3650, 3649]
列表中的每个值都是一个<class 'bs4.element.Tag'>
,您可以调用.text
来检索文本值。
print([x.text for x in lstr_folder_index])
# Output:
['3646', '3650', '3649']