我有这个代码:
rr = []
bs_add = result.find('span', {'class': 'address'})#.text#.replace('n', ' ')
print(bs_add)
print(bs_add.attrs)
print(bs_add.get_text())
这个代码给我的结果是:
<span class="address"><span>595 Buckingham Way Ste 331</span>San Francisco, CA 94132</span>
{'class': ['address']}
595 Buckingham Way Ste 331San Francisco, CA 94132
本节中的问题:给我一个结果:595 Buckingham Way Ste 331San Francisco, CA 94132
但我需要一个这样的结果:595 Buckingham Way Ste 331 San Francisco, CA 94132
。
如何实现
你已经接近目标了,只需为.get_text()
方法指定一个字符或字符串,将提取的文本连接在一起——在这种情况下,是一个空白:
bs_add.get_text(' ', strip=True)
或者对于相同的结果使用stripped_strings
:
' '.join(bs_add.stripped_strings)
输出
595 Buckingham Way Ste 331 San Francisco, CA 94132