我想使用Drupal Feeds Spider导入URL列表(在我的例子中是imdb电影列表)。
为此,我安装了Drupal Feeds和Feeds Spider Fetcher。
当我尝试获取网址列表时,我正在使用Xpath获取链接,有一个问题
例如,我的列表 http://www.imdb.com/search/title?title_type=feature 获取URL,
网址的 XPath 用于.//*[@id='main']/table/tbody/tr[4]/td[3]/a/@href
但最终链接 像这样href="/title/tt0993846/
源无法导入。
我希望链接像这样href="http://imdb.com/title/tt0993846/
我试过这个 Xpath concat('http://imdb.com/', .//*[@id='main']/table/tbody/tr[4]/td[3]/a/@href)
但它没有用,显示错误Download of failed with code -1002.
XPath 2.0 解决方案:
//td[@class='title']/a/resolve-uri(@href)