我有一个HTML内容,它在HTML标记中有<
、>
、%
等HTML实体。
html_text = '<td class="web" width="56" valign="middle" style="color:#333333; font-family:Arial, Helvetica, sans-serif; font-size:12px; line-height:18px; padding-top:38px; padding-bottom:40px;"><img alt="<%= ab("###/a/j/img1_alt_text=Hey") %>" src="<%%= @dropbox_path %>/path/to/image/image.png" width="42" height="41" border="0" hspace="0" vspace="0" style="display:block; vertical-align:top;">String1</td>'
当我用这个HTML内容(字符串)制作HTML文档时使用
html_doc = Nokogiri::HTML(html_text,nil, "UTF-8")
我试图遍历它,要求给我一个文本节点,
html_doc.traverse do|x|
x.text?
temp=x.content
放入温度
我实际上想要这里的'String1'
作为输出,但它给了我:
" src="/path/to/image/image.png" width="42" height="41" border="0" hspace="0" vspace="0" style="display:block; vertical-align:top;">
尝试:
page.css('td')[0].text
有关详细信息,请参阅"使用Nokogiri解析HTML"。