如何将完整的html代码导入Google Sheets



背景

我需要从一个URL导入多个数据值(导入的数据值总是相同的,URL可以更改-用户可以插入她/他需要的任何URL)。

问题

  • 多个=IMPORTXML()将导致电子表格卡住/未卡住正确导入所有情况下的数据
  • 我研究了使用GAS脚本的选项,该脚本的工作方式与=IMPORTXML()类似,并将数据粘贴到电子表格中,但对于复杂的XPath,似乎没有足够的并行或通用解决方案

可能的解决方案

将URL的整个html代码作为一个字符串放在一个单元格中,然后使用=REGEXMATCH()查询这个字符串以找到我需要的内容。

这样做的好处是可以让我只访问一次URL,然后在本地进行检查,这将使速度更快。

期望

<html>
<head>
... <!-- all children -->
</head>
<body>
... <!-- all children -->
</body>
</html>

(在一个/多个单元格中)

我尝试过的

我尝试使用=IMPORTXML(URL,"//html"),但它没有导入实际的标记(在本例中,上下文需要这些标记)。

还有别的办法吗?

您可以使用IMPORTDATA("URL")显示所有URL数据。在大多数情况下,我建议使用query或array_content来限制这一点,因为网站内容可能很长。

参考:

  • IMPORTDATA

最新更新