如何仅选择 h4 标签后面的 p 标签 - 但在 Nokogiri 中不是子标签



我可以使用 Xpath 或 CSS。

我试过了:

my_page.xpath('//h4/p')

但这似乎只寻找p标签,这些标签是h4的孩子。

我正在解析的 HTML 结构如下所示:

<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix )</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>

页面上还有其他pa元素...但基本上我想做的是将 h4 标签中的单词与页面上它后面的链接(而不是嵌套在其中)相关联。

谢谢。

my_page.css("h4 + p")应该可以工作。

+是相邻的同级选择器。

相关内容

  • 没有找到相关文章

最新更新