Nokogiri解析XML文档



我有一个XML文档,其中有许多标签lite-this(在标签:中

<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69<br><br>Poniedziałek-piątek 9:00-20:00<br>Sobota 9:00-20:00<br>Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>

我想由野宫理来解析它。

第一步:

dom = Nokogiri::XML(page, nil, "UTF-8")

第二:

items = dom.xpath("//markers//marker")

我对每个marker的结果是:

<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69"/>

但我想要:

<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69<br><br>Poniedziałek-piątek 9:00-20:00<br>Sobota 9:00-20:00<br>Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>

为什么剪切desc属性?我需要这个。

我将它用于其他XML文档,一切都正常。

这不是一个格式良好的XML:不能将标记放在属性值内。你需要逃离这样的标签:

<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69&lt;br&gt;&lt;br&gt;Poniedziałek-piątek 9:00-20:00&lt;br&gt;Sobota 9:00-20:00&lt;br&gt;Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>

您可以使用许多XML验证器来检查文件,包括诸如http://www.w3schools.com/xml/xml_validator.asp以及诸如CCD_ 3之类的命令行工具。

相关内容

  • 没有找到相关文章

最新更新