红宝石中的字符编码



我正在使用Nokogiri解析来自一个荷兰站点的一些数据,并将数据保存到csv中。但数据未正确显示。例如,在表单上是Einddatum1空白区域,但是当我在保存之前将其打印到控制台中时,它显示为" \u00A0"。其他字符串也没有正确显示,例如"Univ\u00E9 Zorg Geregeld Polis"。

{:Bsn=>"112511111",
 :Verzekerde=>"VerzekerdeAHM Andes-Faasse",
 :Pakketnaam1=>"Univu00E9 Zorg Geregeld Polis",
 :Verzekerdennummer1=>"1234987654",
 :Begindatum1=>"01 jan 2012",
 :Einddatum1=>"u00A0",
 }

也许这个html页面的标题可能是相关的:

<!doctype html>
<!-- paulirish.com/2008/conditional-stylesheets-vs-css-hacks-answer-neither/ -->
<!--[if lt IE 7 ]> <html class="no-js ie6" lang="en"> <![endif]-->
<!--[if IE 7 ]>    <html class="no-js ie7" lang="en"> <![endif]-->
<!--[if IE 8 ]>    <html class="no-js ie8" lang="en"> <![endif]-->
<!--[if (gte IE 9)|!(IE)]><!--> <html class="no-js" lang="en"> <!--<![endif]-->
<head id="Head1"><meta charset="utf-8" />
    <!-- Always force latest IE rendering engine (even in intranet)
         Remove this if you use the .htaccess -->
    <meta http-equiv="X-UA-Compatible" content="IE=edge" /><title>
    Verzekeringsrecht controleren
</title><meta http-equiv="cache-control" content="no-cache" /><meta http-equiv="content-language" content="nl-NL" />

它接缝就像 utf-8 一样,但这些字符有问题。如何正确编码它们?

然后该行将显示为:Pakketnaam1=>"Univé Zorg Geregeld Polis",

这是应该存在的,并且您的控制台编码没有定义,因此 Ruby 不知道在打印时如何显示 Unicode 字符,还是应该有更多的文本?

相关内容

  • 没有找到相关文章

最新更新