在我的scraper中,我使用.select("div.class-name")方法,但有一个问题:它返回非分隔值。
我的html:
结构
<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>
结果它给了我一个列表["Text1Text2Text3"]。有什么方法来分离它在html?
你是说这样吗?
from bs4 import BeautifulSoup
sample_html = '''<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>'''
print(BeautifulSoup(sample_html, "lxml").select("div.class-name div"))
输出:
[<div>Text1</div>, <div>Text2</div>, <div>Text3</div>]