我有一个XML文档,其中有许多标签lite-this(在标签:中
<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69<br><br>Poniedziałek-piątek 9:00-20:00<br>Sobota 9:00-20:00<br>Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>
我想由野宫理来解析它。
第一步:
dom = Nokogiri::XML(page, nil, "UTF-8")
第二:
items = dom.xpath("//markers//marker")
我对每个marker
的结果是:
<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69"/>
但我想要:
<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69<br><br>Poniedziałek-piątek 9:00-20:00<br>Sobota 9:00-20:00<br>Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>
为什么剪切desc
属性?我需要这个。
我将它用于其他XML文档,一切都正常。
这不是一个格式良好的XML:不能将标记放在属性值内。你需要逃离这样的标签:
<marker city="City" address="street" coords="52.386912449620866, 16.983248591423035" desc="tel. 061 874 96 69<br><br>Poniedziałek-piątek 9:00-20:00<br>Sobota 9:00-20:00<br>Niedziela 10:00-17:00" photo="" wa_firstname="861" open="1"/>
您可以使用许多XML验证器来检查文件,包括诸如http://www.w3schools.com/xml/xml_validator.asp以及诸如CCD_ 3之类的命令行工具。