删除另一个标签中的标签美丽汤



u如何像这样提取标签中的文本:

<div><blockquote type="cite" class=""><p>Find me<p>
<blockquote cite="mid:609415CB-0979-47C1-9A75-CE1BE65939A0@wiwacom.fr" type="cite" class=""><p>Not me<p>
<blockquote type="cite" class=""><p>Not me too<p>
</blockquote>
</blockquote>

我想得到:

Find me

配蟒蛇和美汤

您可以使用.find来获取所需的文本。

演示:

from bs4 import BeautifulSoup
s = """<div><blockquote type="cite" class=""><p>Find me</p>
<blockquote cite="mid:609415CB-0979-47C1-9A75-CE1BE65939A0@wiwacom.fr" type="cite" class=""><p>Not me<p>
<blockquote type="cite" class=""><p>Not me too<p>
</blockquote>
</blockquote></div>"""
soup = BeautifulSoup(s, "html.parser")
print(soup.find("div").find("p").text)

输出:

Find me

注意:您有一些无效的p标签<p> ==> </p>

最新更新