XPath如何检查标题值是否为扩展字符



这是我想找到

的html
<a href="/audio-books/type/computer/page/2/">»</a>

问题是»什么是

&raquo;

我尝试过:

response.xpath('//div[@class="wp-pagenavi"]/a[@title="»"]' )

response.xpath('//div[@class="wp-pagenavi"]/a[@title="&raquo;"]' )

但是它不起作用。

如果值来自字符实体或扩展字符,是否有某种方法可以检查XPath中的值吗?

我试图找到Lin到下一页,以便我可以使用

response.xpath('//div[@class="wp-pagenavi"]/a[@title="2"]' )

这很好。

首先是不正确的,因为您使用的是 title属性要匹配,这是不正确的,字符在 text()内,而不是 title。此XPath应该有效:

response.xpath(u'//a[./text()="xbb"]')

我没有尝试运行它,但是您应该使用小数实体通过XPath来查找扩展字符。

对于&raquo;,您应该使用&#187;,您的XPath应该像

div[@class="wp-pagenavi"]/a[@title="&#187;"]'

请参阅此处的完整图表以获取参考。

如果它不起作用,则可以选择&raquo;的Unicode字符,此外,您可以看到此帖子,希望这对您有帮助。

最新更新