如何使用谷歌工作表中的XMLimport函数从具有相同类名的DIV中获取不同的值?



这是我尝试从中抓取值的网页上的HTML代码:

<div class="parentclass">
<div class="subclass">
<a class="subclass1" href="https://www.google.com">         
<span class="_getvalclass">This is a sample text</span>
</a>
</div>
<div class="subclass1">
<div class="_getvalclass">2:30</div>      
</div>
<div class="subclass1">
<div class="_getvalclass">105</div>      
</div>
</div>

我在谷歌工作表中使用此功能

=SUBSTITUTE(CLEAN(IMPORTXML("http://www.pagename.com", "//div[@class='_getvalclass']")),",","&#44;")

我得到这个值:

2:30

现在我有两个类名"_getvalclass"的div,有什么方法可以定位每个div 并获得单独的值? 比如使用索引定位div: _getvalclass[0], _getvalclass[1]

还是有其他方法?

第 -2 部分问题(下面的 HTML(:

<div class="o39aH">
<div class="_3sle8">
<a class="T3XY3" href="/some-page">
<span class="_2KIv8">Test</span>
<span class="_2UUUp">Unique text only in some page (some page it is missing)</span>
</a>
</div>
<div class="T3XY3">
<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>
</div>
<div class="T3XY3">
<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>
</div>
<button class="T3XY3">
<div class="_2KIv8">some text</div>
<div class="_2UUUp">Favorite</div>
</button>
<button class="T3XY3">
<div class="_2KIv8">Other text</div>
<div class="_2UUUp">Playlist</div>
</button>
</div>

在某些情况下,我想拉这些值

<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>

在其他情况下,我想拉取这些值

<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>

这个答案怎么样?请把这看作是几个答案之一。

回答问题 1:

如果要使用索引为"div"的 xpath 检索2:30,那么以下 xpath 怎么样?

示例路径:

//div[@class='parentclass']/div[2]

//div[@class='parentclass']/div[2]/div[@class='_getvalclass']/text()

示例公式:

=IMPORTXML(A1,"//div[@class='parentclass']/div[2]")
  • 在这种情况下,http://www.pagename.com被放入单元格"A1"中。

注意:

  • 您可以在此处测试 xpath。
  • 我不确定您的实际网址。所以我不确定上面的 xpath 是否可以直接用于您的情况。因为我不确定您的问题中的 HTML 内容是否可以由IMPORTXML检索。

如果这不是你想要的方向,我很抱歉。

回答问题2:

示例路径:

模式 1:
//div[@class='o39aH']/div[2]

//div[@class='T3XY3'][1]

//div[@class='o39aH']/div[@class='T3XY3'][1]
模式 2:
//div[@class='o39aH']/div[3]

//div[@class='T3XY3'][2]

//div[@class='o39aH']/div[@class='T3XY3'][2]

示例公式:

请将网址输入单元格"A1"。

模式 1:
=IMPORTXML(A1,"//div[@class='o39aH']/div[2]")
  • 在这种情况下,将检索2:30Time
模式 2:
=IMPORTXML(A1,"//div[@class='o39aH']/div[3]")
  • 在这种情况下,将检索100Pounds

注意:

  • 您可以在此处测试 xpath。
  • 如果要检索TestUnique text only in some page (some page it is missing),可以使用//div[@class='o39aH']/div[@class='_3sle8']/a[@class='T3XY3']的 xpath。

相关内容

最新更新