python 美丽汤按字符串匹配元素等于标签或属性键或属性值



我需要代码将元素中的文本与正则表达式匹配,例如: 匹配 html 元素中的电话,但有时元素的 TYPE 是电话或电话,有时 TAG 是电话,有时是 NAME,有时是 CLASS 等等,有时属性本身称为电话。

如何通过查询来感知元素: 像这样:

soup.findAll(re.compile("phone"), attrs=re.compile('phone'))

不需要重新

res = soup.select("phone, #phone, .phone, [name='phone'], [phone!='']")

使用 CSS 选择器phone匹配标记电话、#phoneID 电话.phone类名电话,[name='phone']捕获值为"phone"的属性"name",[phone!='']没有空值的属性"phone">

最新更新