小贝子编程

如果所需的内容没有类或 id，如何使用 nokogiri 解析 HTML？

本文关键字：id 何使用 nokogiri HTML 解析如果 ruby parsing web-scraping nokogiri
更新时间 : 2023-08-20
英文 : How to parse HTML using nokogiri if the required content doesn't have a class or id?

我正在尝试抓取一些内容并使用Nokogiri解析它!现在受到打击，因为我正试图得到一些文本内容，其中不包含在任何类型的标签。只有文本，其中一些在标签中没有任何类或id。

我可以通过搜索内容/文本的开始和结束来找到内容，并在两者之间获得所有内容吗?

<body>
text <br/>
<ul>
<li>some more text </li>
</body>

CSS选择器或Xpath，任何解决方案都很棒。

require "nokogiri"
Nokogiri::HTML.parse(<<_).css("body").children.first.text
<body>
text <br/>
<ul>
<li>some more text </li>
</body>
_
# => "ntext "

Nokogiri::HTML.parse(<<_).css("body").children.first.text.strip
<body>
text <br/>
<ul>
<li>some more text </li>
</body>
_
# => "text"

如果所需的内容没有类或 id，如何使用 nokogiri 解析 HTML？

相关内容

最新更新

热门标签：