我想在某个HTML标记中获得文本。它看起来像:
<div id="data123">data1: value1<br>data2: value2<br> data3: value</div>
我的代码如下:
html_page = Nokogiri::HTML open 'my_url'
who_is_raw = html_page.css('div#data123')[0] #.text
我要么在没有<br>
标签的<div>
标签内获得文本,要么在里面获得所有<br>
的整个<div>
。但是,我只想要<div>
标签和<br>
标签内的文本。
我该怎么做?
尝试使用inner_html
who_is_raw = html_page.css('div#data123')[0].inner_html