从BeautifulSoup中的span标记中提取数据内容



我有这样的HTML代码:

<li class="IDENTIFIER"><h5 class="hidden">IDENTIFIER</h5><p>
<span class="tooltip-iws" data-toggle="popover" data-content="SOME TEXT">
other text</span></p></li>

我想从数据内容中获得SOME TEXT

我写了

target = soup.find('span', {'class' : 'tooltip-iws'})['data-content']

为了得到跨度,我写了

identifier_elt= soup.find("li", {'class': 'IDENTIFIER'})

来上课,但我不知道如何把两者结合起来。

但是类tooltip-iws不是唯一的,如果我只是使用它,我会得到无关的结果(在代码片段之前,还有其他跨度与同一个类(这就是为什么我想在类IDENTIFIER中指定我的搜索。我怎样才能在BeautifulSoup中做到这一点?

尝试使用css selector

soup.select_one("li[class='IDENTIFIER'] > p > span")['data-content']

尝试使用selectorlib,应该可以解决您的问题,如果您需要进一步的帮助,请评论

https://selectorlib.com/

最新更新