我一直在尝试使用 xpath 从以下代码中提取电子邮件地址已有一段时间了,但没有成功......
http://pastie.org/4172907(第 78 行)
这是我到目前为止尝试过的:
//tr/td/div[@class='geTextA5'][2]/a
我已经在xpath上摆弄了三个多小时,尝试了许多不同的变体。我对 xpath 很陌生,所以我希望有一种更简单的方法来实现这一点。
我感谢对此的任何帮助。
如果您确信所有电子邮件都有一个 mailto 超链接,如示例中所示,那么您可以尝试以下 xpath。
//a[starts-with(@href, 'mailto')]/text()
进一步补充,如果您想解析文本中的电子邮件,但它们没有包装在锚点中:
//*[contains(text(), '@')]