这是我尝试从中抓取值的网页上的HTML代码:
<div class="parentclass">
<div class="subclass">
<a class="subclass1" href="https://www.google.com">
<span class="_getvalclass">This is a sample text</span>
</a>
</div>
<div class="subclass1">
<div class="_getvalclass">2:30</div>
</div>
<div class="subclass1">
<div class="_getvalclass">105</div>
</div>
</div>
我在谷歌工作表中使用此功能
=SUBSTITUTE(CLEAN(IMPORTXML("http://www.pagename.com", "//div[@class='_getvalclass']")),",",",")
我得到这个值:
2:30
现在我有两个类名"_getvalclass"的div,有什么方法可以定位每个div 并获得单独的值? 比如使用索引定位div: _getvalclass[0], _getvalclass[1]
还是有其他方法?
第 -2 部分问题(下面的 HTML(:
<div class="o39aH">
<div class="_3sle8">
<a class="T3XY3" href="/some-page">
<span class="_2KIv8">Test</span>
<span class="_2UUUp">Unique text only in some page (some page it is missing)</span>
</a>
</div>
<div class="T3XY3">
<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>
</div>
<div class="T3XY3">
<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>
</div>
<button class="T3XY3">
<div class="_2KIv8">some text</div>
<div class="_2UUUp">Favorite</div>
</button>
<button class="T3XY3">
<div class="_2KIv8">Other text</div>
<div class="_2UUUp">Playlist</div>
</button>
</div>
在某些情况下,我想拉这些值
<div class="_2KIv8">2:30</div>
<div class="_2UUUp">Time</div>
在其他情况下,我想拉取这些值
<div class="_2KIv8">100</div>
<div class="_2UUUp">Pounds</div>
这个答案怎么样?请把这看作是几个答案之一。
回答问题 1:
如果要使用索引为"div"的 xpath 检索2:30
,那么以下 xpath 怎么样?
示例路径:
//div[@class='parentclass']/div[2]
或
//div[@class='parentclass']/div[2]/div[@class='_getvalclass']/text()
示例公式:
=IMPORTXML(A1,"//div[@class='parentclass']/div[2]")
- 在这种情况下,
http://www.pagename.com
被放入单元格"A1"中。
注意:
- 您可以在此处测试 xpath。
- 我不确定您的实际网址。所以我不确定上面的 xpath 是否可以直接用于您的情况。因为我不确定您的问题中的 HTML 内容是否可以由
IMPORTXML
检索。
如果这不是你想要的方向,我很抱歉。
回答问题2:
示例路径:
模式 1://div[@class='o39aH']/div[2]
和
//div[@class='T3XY3'][1]
和
//div[@class='o39aH']/div[@class='T3XY3'][1]
模式 2://div[@class='o39aH']/div[3]
和
//div[@class='T3XY3'][2]
和
//div[@class='o39aH']/div[@class='T3XY3'][2]
示例公式:
请将网址输入单元格"A1"。
模式 1:=IMPORTXML(A1,"//div[@class='o39aH']/div[2]")
- 在这种情况下,将检索
2:30
和Time
。
=IMPORTXML(A1,"//div[@class='o39aH']/div[3]")
- 在这种情况下,将检索
100
和Pounds
。
注意:
- 您可以在此处测试 xpath。
- 如果要检索
Test
和Unique text only in some page (some page it is missing)
,可以使用//div[@class='o39aH']/div[@class='_3sle8']/a[@class='T3XY3']
的 xpath。