我正在为网站创建刮板:https://www.oddsportal.com/darts/europe/european-championship/results/
我正在使用Splash插件到渲染JavaScript
我想遵循前几年以获取历史数据,前一年的课程"不活动"。因此,我想要一个找到"活跃"一年的XPath表达,并在上一年获得 href 。
这是HTML的片段:
<div class="main-menu2 main-menu-gray"><ul class="main-filter"><li><span class="active"><strong><a href="/darts/europe/european-championship/results/">2018</a></strong></span></li><li><span class="inactive"><strong><a href="/darts/europe/european-championship-2017/results/">2017</a></strong></span></li><li><span class="inactive"><strong><a href="/darts/europe/european-championship-2016/results/">2016</a></strong></span>
这是我的尝试:
response.xpath('//div[@class="main-menu2 main-menu-gray"]/ul/following-sibling::li[child::span[@class="active"]]/strong/a/@href').get()
我希望这将返回:
/darts/europe/european-championship-2017/results/
这是当前URL的前一年。
这是xpath中的选项。
(//div[@class="main-menu2 main-menu-gray"]/ul/li[.//span[@class="active"]]/following-sibling::li//a)[1]
简单,但不确定您是否必须在活动元素上绝对中继。
(//div[@class='main-menu2 main-menu-gray']//span[@class='inactive']//a)[1]