背景
我需要从一个URL导入多个数据值(导入的数据值总是相同的,URL可以更改-用户可以插入她/他需要的任何URL)。
问题
- 多个
=IMPORTXML()
将导致电子表格卡住/未卡住正确导入所有情况下的数据 - 我研究了使用GAS脚本的选项,该脚本的工作方式与
=IMPORTXML()
类似,并将数据粘贴到电子表格中,但对于复杂的XPath,似乎没有足够的并行或通用解决方案
可能的解决方案
将URL的整个html代码作为一个字符串放在一个单元格中,然后使用=REGEXMATCH()
查询这个字符串以找到我需要的内容。
这样做的好处是可以让我只访问一次URL,然后在本地进行检查,这将使速度更快。
期望
<html>
<head>
... <!-- all children -->
</head>
<body>
... <!-- all children -->
</body>
</html>
(在一个/多个单元格中)
我尝试过的
我尝试使用=IMPORTXML(URL,"//html")
,但它没有导入实际的标记(在本例中,上下文需要这些标记)。
还有别的办法吗?
您可以使用IMPORTDATA("URL")显示所有URL数据。在大多数情况下,我建议使用query或array_content来限制这一点,因为网站内容可能很长。
参考:
- IMPORTDATA