读取 html 中的不间断空格会产生一个符号



我终于设法解析了网站的各个部分:

get '/' do
  url = '<website>'
  data = Nokogiri::HTML(open(url))
  @rows = data.css("td[valign=top] table tr") 
  erb :muster
end

现在我试图提取我的观点中的某条线。因此,我输入了我的HTML代码:

<%= @rows[2] %> 

它实际上返回代码,但它有一个空格问题:

<td class="class_name">&nbsp;</td>

相反,它说

<td class="class_name">�</td>

我做错了什么?

尝试替换

data = Nokogiri::HTML(open(url))

data = Nokogiri::HTML(open(url).encode('ASCII-8BIT'))

这样,nokogiri 就不会尝试使用 UTF-8 来打印&nbsp;而不是 ASCII 字符0xA0。

相关内容

  • 没有找到相关文章

最新更新