如何使用谷歌工作表中的XMLimport函数从具有相同类名的DIV中获取不同的值?

这是我尝试从中抓取值的网页上的HTML代码：

<div class="parentclass">
<div class="subclass">
<a class="subclass1" href="https://www.google.com">         
<span class="_getvalclass">This is a sample text</span>
</a>
</div>
<div class="subclass1">
<div class="_getvalclass">2:30</div>      
</div>
<div class="subclass1">
<div class="_getvalclass">105</div>      
</div>
</div>

我在谷歌工作表中使用此功能

=SUBSTITUTE(CLEAN(IMPORTXML("http://www.pagename.com", "//div[@class='_getvalclass']")),",","&#44;")

我得到这个值：

2:30

现在我有两个类名"_getvalclass"的div，有什么方法可以定位每个div 并获得单独的值？比如使用索引定位div： _getvalclass[0]， _getvalclass[1]

还是有其他方法？

第 -2 部分问题(下面的 HTML(：

<div class="o39aH">
<div class="_3sle8">
<a class="T3XY3" href="/some-page">
<span class="_2KIv8">Test</span>
<span class="_2UUUp">Unique text only in some page (some page it is missing)</span>
</a>
</div>
<div class="T3XY3">
<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>
</div>
<div class="T3XY3">
<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>
</div>
<button class="T3XY3">
<div class="_2KIv8">some text</div>
<div class="_2UUUp">Favorite</div>
</button>
<button class="T3XY3">
<div class="_2KIv8">Other text</div>
<div class="_2UUUp">Playlist</div>
</button>
</div>

在某些情况下，我想拉这些值

<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>

在其他情况下，我想拉取这些值

<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>

这个答案怎么样？请把这看作是几个答案之一。

回答问题 1：

如果要使用索引为"div"的 xpath 检索2:30，那么以下 xpath 怎么样？

示例路径：

//div[@class='parentclass']/div[2]

或

//div[@class='parentclass']/div[2]/div[@class='_getvalclass']/text()

示例公式：

=IMPORTXML(A1,"//div[@class='parentclass']/div[2]")

在这种情况下，http://www.pagename.com被放入单元格"A1"中。

注意：

您可以在此处测试 xpath。
我不确定您的实际网址。所以我不确定上面的 xpath 是否可以直接用于您的情况。因为我不确定您的问题中的 HTML 内容是否可以由IMPORTXML检索。

如果这不是你想要的方向，我很抱歉。

回答问题2：

示例路径：

模式 1：

//div[@class='o39aH']/div[2]

和

//div[@class='T3XY3'][1]

和

//div[@class='o39aH']/div[@class='T3XY3'][1]

模式 2：

//div[@class='o39aH']/div[3]

和

//div[@class='T3XY3'][2]

和

//div[@class='o39aH']/div[@class='T3XY3'][2]

示例公式：

请将网址输入单元格"A1"。

模式 1：

=IMPORTXML(A1,"//div[@class='o39aH']/div[2]")

在这种情况下，将检索2:30和Time。

模式 2：

=IMPORTXML(A1,"//div[@class='o39aH']/div[3]")

在这种情况下，将检索100和Pounds。

注意：

您可以在此处测试 xpath。
如果要检索Test和Unique text only in some page (some page it is missing)，可以使用//div[@class='o39aH']/div[@class='_3sle8']/a[@class='T3XY3']的 xpath。

回答问题 1：

示例路径：

示例公式：

注意：

回答问题2：

示例路径：

示例公式：

注意：

相关内容

最新更新

热门标签：