查找锚标记的文本,这些文本是名为div的特定类的子类


<div class="outer">
<div class= ""></div>
<div class= "inner">
<a href= "..." class="innera">text1</a>
<a href= "..." class="innera">text2</a>
<a href= "..." class="innnera">text3</a>
</div>
</div>

假设有一个外部div,它包含两个子div。第一个没有类名,第二个包含锚标记。这个页面有很多名为"outer"的div类。如何获取这些a标签中的文本?我想计算div class="inner"中锚标记文本的数量。因为page有很多class name="outer"的div,而这些div在子div class name="inner"中包含不同数量的a href标记。

div.outer > div.inner内获取a执行循环

outers = soup.select('div.outer')
for inner in outers:
atags = inner.select('div.inner a')
print(len(atags))
for a in atags:
print(a['href'])

最新更新