XPATH - 如何在每个html元素中拾取文本,而不考虑类



我试图从结构不统一的网页中获取一些内容。我想做的是告诉 XPATH 按照它看到它们的顺序抓取 html 标签中的任何内容并返回结果,而不必指定div 名称等,因为它们是不同的并且不是很统一。

所以我需要知道如何说'按照从标签中找到的顺序返回任何 html 内容,无论它们是类、ems、强标签等。我对 XPATH 的唯一经验是指定实际的div 名称,例如:

//div[@id='tab_info']

这个XPath,

string(/)

将返回整个 XML 或 HTML 文档的字符串值。 也就是说,它将根据请求按文档顺序返回所有文本的单个字符串。

最新更新