beautifulsoup通过span标记之间的空格获取文本



我有这个代码:

rr = []
bs_add = result.find('span', {'class': 'address'})#.text#.replace('n', ' ')
print(bs_add)
print(bs_add.attrs)
print(bs_add.get_text())

这个代码给我的结果是:

<span class="address"><span>595 Buckingham Way Ste 331</span>San Francisco, CA 94132</span>
{'class': ['address']}
595 Buckingham Way Ste 331San Francisco, CA 94132

本节中的问题:给我一个结果:595 Buckingham Way Ste 331San Francisco, CA 94132

但我需要一个这样的结果:595 Buckingham Way Ste 331 San Francisco, CA 94132

如何实现

你已经接近目标了,只需为.get_text()方法指定一个字符或字符串,将提取的文本连接在一起——在这种情况下,是一个空白:

bs_add.get_text(' ', strip=True)

或者对于相同的结果使用stripped_strings

' '.join(bs_add.stripped_strings)

输出

595 Buckingham Way Ste 331 San Francisco, CA 94132

最新更新