在 GSheets 中使用 ImportXML 抓取时出现"Imported content is empty."错误

我需要将图像的源网址从目录的链接网页抓取到列中，放入Google表格中。

我认为使用IMPORTXML函数将是最简单的解决方案，但我每次都收到#N/A"导入的内容为空">错误。

我也尝试使用此扩展来定义 XPath，但仍然是相同的错误。

页面的源代码，其中图片源网址为：

<div class="centerer" id="rbt-gallery-img-1">
<i class="spinner">
<span></span>
</i>
<img data-lazy="//i.example.com/01.jpg" border="0"/>
</div>

所以我想将"i.example.com/01.jpg"值获取到 B2，然后是指向相邻单元格的更多图像 URL。

我使用的功能是：

=IMPORTXML(A2,"//img[@class='centerer']/@data-lazy")

我尝试使用微调器而不是中心器，结果相同。

您可以使用以下 XPath-1.0 表达式获取字符串i.example.com/01.jpg：

substring-after(//div[@class='centerer']/img/@data-lazy,'//')

如果不需要删除前导//，则只能使用

//div[@class='centerer']/img/@data-lazy

因此，在第一种情况下，Google-Sheets表达式可以是

=IMPORTXML(A2,"substring-after(//div[@class='centerer']/img/@data-lazy,'//')")

在第二个中，它可能是

=IMPORTXML(A2,"//div[@class='centerer']/img/@data-lazy")

相关内容