我写了这个小程序:
require 'open-uri'
require 'nokogiri'
class Kapitel
attr_accessor :von, :bis, :bezeichnung
end
class SubKapitel
attr_accessor :von, :bis, :bezeichnung
end
def parse_file
doc = Nokogiri::XML(File.open("test.xml"))
parse_xml(doc)
end
def parse_xml(doc)
doc.root.elements.each do |node|
parse_kapitel(node)
end
end
def parse_kapitel(node)
if node.node_name.eql? 'nummer'
tmp_kapitel = Kapitel.new
end
if node.node_name.eql? 'gruppe'
tmp_kapitel = SubKapitel.new
end
tmp_kapitel.von = node['V'] if node.node_name.eql? 'von_icd_code'
tmp_kapitel.bis = node['V'] if node.node_name.eql? 'bis_icd_code'
end
puts parse_file
使用它,我解析了这个 XML 文件:
<kapitel>
<nummer V="1"/>
<von_icd_code V="A00"/>
<bis_icd_code V="B99"/>
<bezeichnung V="Bestimmte infektiöse und parasitäre Krankheiten"/>
<gruppen_liste>
<gruppe>
<von_icd_code V="A00"/>
<bis_icd_code V="A09"/>
<bezeichnung V="Infektiöse Darmkrankheiten"/>
<diagnosen_liste>
<diagnose>
<icd_code V="A00.-"/>
<bezeichnung V="Cholera"/>
<abrechenbar V="n"/>
但不知何故,我得到了这个错误:
test.rb:32:in `parse_kapitel': undefined method `von=' for nil:NilClass(NoMethodError)
我认为问题是von-icd-code
在XML文档中出现了两次。
有人可以帮助我解决这个问题吗?
在方法内部
def parse_kapitel(node)
if node.node_name.eql? 'nummer'
tmp_kapitel = Kapitel.new
end
if node.node_name.eql? 'gruppe'
tmp_kapitel = SubKapitel.new
end
tmp_kapitel.von = node['V'] if node.node_name.eql? 'von_icd_code'
tmp_kapitel.bis = node['V'] if node.node_name.eql? 'bis_icd_code'
end
nil:NilClass(NoMethodError) 的错误未定义方法 'von=' 表示当时node
名称是 'von_icd_code'
,而不是'nummer'
。这就是为什么if node.node_name.eql? 'nummer'
被评估为false
。但是在 Ruby 中,局部变量是在解析时创建的,每当遇到任何这样的赋值语句时,例如 tmp_kapitel = Kapitel.new
.现在由于if node.node_name.eql? 'nummer'
的flase
,正如我之前所说,tmp_kapitel
局部变量持有nil
,而不是Kapitel.new
的对象。而且NilClass
没有任何称为#von
的方法,因此将合法错误抛给您。
require 'nokogiri'
doc = Nokogiri::XML(' <kapitel>
<nummer V="1"/>
<von_icd_code V="A00"/>
<bis_icd_code V="B99"/>
<bezeichnung V="Bestimmte infektise und parasitre Krankheiten"/>FFC3U+FFA4re Krankheiten"/>
<gruppen_liste>
<gruppe>
<von_icd_code V="A00"/>
<bis_icd_code V="A09"/>
<bezeichnung V="Infektise Darmkrankheiten"/>krankheiten"/>
<diagnosen_liste>
<diagnose>
<icd_code V="A00.-"/>
<bezeichnung V="Cholera"/>
<abrechenbar V="n"/>')
doc.errors
哪些输出:
[
[0] #<Nokogiri::XML::SyntaxError: Premature end of data in tag diagnose line 12>,
[1] #<Nokogiri::XML::SyntaxError: Premature end of data in tag diagnosen_liste line 11>,
[2] #<Nokogiri::XML::SyntaxError: Premature end of data in tag gruppe line 7>,
[3] #<Nokogiri::XML::SyntaxError: Premature end of data in tag gruppen_liste line 6>,
[4] #<Nokogiri::XML::SyntaxError: Premature end of data in tag kapitel line 1>
]
如果我们看看Nokogiri必须做什么来修复XML:
puts doc.to_xml
我们看到它添加了结束标签。
<?xml version="1.0"?>
<kapitel>
<nummer V="1"/>
<von_icd_code V="A00"/>
<bis_icd_code V="B99"/>
<bezeichnung V="Bestimmte infektise und parasitre Krankheiten"/>
<gruppen_liste>
<gruppe>
<von_icd_code V="A00"/>
<bis_icd_code V="A09"/>
<bezeichnung V="Infektise Darmkrankheiten"/>
<diagnosen_liste>
<diagnose>
<icd_code V="A00.-"/>
<bezeichnung V="Cholera"/>
<abrechenbar V="n"/></diagnose></diagnosen_liste></gruppe></gruppen_liste></kapitel>
它能够正确执行此操作,但是在格式不正确或具有更复杂的数据的XML中,它可能做得不好。而且,在这一点上,任何关于生成的 DOM 的后续工作都将是可疑的。