我有一个XML文件,我正在尝试用Nokogiri分析它:
<?xml version="1.0" encoding="ISO-8859-15"?>
<ehd:ehd ehd_version="1.40" xmlns:ehd="urn:ehd/001" xmlns="urn:ehd/icd/001">
<ehd:header>
<ehd:document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
<ehd:service_tmr V="2013-07-01..2013-12-31"/>
</ehd:header>
<ehd:body>
<icd_stammdaten>
<kapitel_liste>
<kapitel>
<nummer V="1"/>
.......
通常我通过以下方式获得一个节点:
doc = Nokogiri::XML(params[:file])
puts doc.css('nummer')
现在我试过:
doc = Nokogiri::XML(params[:file])
puts doc.css('ehd:document_type_cd')
要获取此输出,请执行以下操作:
<ehd:document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
但不知何故,我没有得到输出!这怎么可能?
在处理 XML 时使用 XPATH。
当XML中会出现同名时,那么下面使用Nokogiri::XML::Document#remove_namespaces!
的技巧将使您的生活变得轻松:
require 'nokogiri'
doc = Nokogiri::XML::Document.parse <<-eot
<?xml version="1.0" encoding="ISO-8859-15"?>
<ehd:ehd ehd_version="1.40" xmlns:ehd="urn:ehd/001" xmlns="urn:ehd/icd/001">
<ehd:header>
<ehd:document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
<ehd:service_tmr V="2013-07-01..2013-12-31"/>
</ehd:header>
eot
doc.remove_namespaces!
puts doc.at_xpath('//document_type_cd')
# >> <document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
或者,如果你足够擅长命名空间的XML,那么请执行以下操作:
require 'nokogiri'
doc = Nokogiri::XML::Document.parse <<-eot
<?xml version="1.0" encoding="ISO-8859-15"?>
<ehd:ehd ehd_version="1.40" xmlns:ehd="urn:ehd/001" xmlns="urn:ehd/icd/001">
<ehd:header>
<ehd:document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
<ehd:service_tmr V="2013-07-01..2013-12-31"/>
</ehd:header>
eot
puts doc.at_xpath('//ehd:document_type_cd','document_type_cd')
# >> <ehd:document_type_cd V="ICD" DN="ICD-Stammdatei" S="1.2.276.0.76.5.100"/>
> Nokogiri 教程说:
您不必使用 XPath 来获得命名空间的好处。也可以使用CSS选择器。CSS 只是使用管道符号来指示命名空间搜索。
所以在这种情况下,你可以做:
puts doc.css('ehd|document_type_cd')
如果您更喜欢使用 CSS 而不是 XPath。