我正在使用YQL从网站上抓取一些图像。
问题是我只想要该网站的前5张图片。
我有以下查询:
select * from html where url="http://myanimelist.net/anime/9253/Steins;Gate" and xpath='//img[position()<=5]'
但是,它将返回所有图像元素,而不是前5个。
YQL控制台:使用上面的XPath 打开YQL控制台
我的XPath查询有什么问题吗?
PS:我不能使用LIMIT 5
,因为我可能还需要刮一些其他标签。
此XPath表达式将选择前5个img
元素:
//img[count(preceding::img) < 5]
以下是整个YQL查询:
select * from html where url="http://myanimelist.net/anime/9253/Steins;Gate" and xpath='//img[count(preceding::img) < 5]'
您可以在YQL控制台上观看它的工作