我需要代码将元素中的文本与正则表达式匹配,例如: 匹配 html 元素中的电话,但有时元素的 TYPE 是电话或电话,有时 TAG 是电话,有时是 NAME,有时是 CLASS 等等,有时属性本身称为电话。
如何通过查询来感知元素: 像这样:
soup.findAll(re.compile("phone"), attrs=re.compile('phone'))
不需要重新
res = soup.select("phone, #phone, .phone, [name='phone'], [phone!='']")
使用 CSS 选择器phone
匹配标记电话、#phone
ID 电话.phone
类名电话,[name='phone']
捕获值为"phone"的属性"name",[phone!='']
没有空值的属性"phone">