当所有 div 类名和 span 类名相同时,如何使用 Java 中的 jsoup 查找内部元素


<div class="xyOfqd">
<div class="hAyfc">
<div class="BgcNfc">Updated</div>
<span class="htlgb">
<div>
<span class="htlgb">July 14, 2018</span>
</div>
</span>
</div>
<div class="hAyfc">
<div class="BgcNfc">Size</div>
<span class="htlgb">
<div><span class="htlgb">3.9M</span></div>
</span>
</div>
</div>

我想要上面html中的所有文本在java中使用jsoup。

喜欢这个 更新 七月 14, 2018 大小 3.9米

更新和大小是恒定的,但日期和 3.9M 是动态值。

基本上,我正在尝试从谷歌Play商店中废弃这些值。

您在这里有两个问题:

  1. 查找具有相同名称的元素的 CSS 选择器。这是比较容易的部分,因为它们都有不同的选择器。如果您使用浏览器的开发人员工具,您将看到update的选择器是div.hAyfc:nth-child(1) > div:nth-child(1)的,size的选择器是div.hAyfc:nth-child(2) > div:nth-child(1)的。
  2. 获取动态值 - 好吧,Jsoup无法获取动态值。您可以尝试找到获取这些值的ajax调用,并尝试对 Jsoup 执行相同的操作,或者使用其他工具,如 PhantomJS。

最新更新