如何在HTML标记中获得文本

  • 本文关键字:文本 HTML ruby nokogiri
  • 更新时间 :
  • 英文 :


我想在某个HTML标记中获得文本。它看起来像:

<div id="data123">data1: value1<br>data2: value2<br> data3: value</div>

我的代码如下:

html_page = Nokogiri::HTML open 'my_url'
who_is_raw = html_page.css('div#data123')[0] #.text

我要么在没有<br>标签的<div>标签内获得文本,要么在里面获得所有<br>的整个<div>。但是,我只想要<div>标签和<br>标签内的文本。

我该怎么做?

尝试使用inner_html

who_is_raw = html_page.css('div#data123')[0].inner_html

相关内容

  • 没有找到相关文章

最新更新