这是我第一次尝试使用Nokogiri,但它不起作用,我不明白为什么:
这是XML:
<?xml version="1.0"?>
<catalog>
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
<genre>Computer</genre>
<price>44.95</price>
<publish_date>2000-10-01</publish_date>
<description>An in-depth look at creating applications
with XML.</description>
</book>
</catalog>
我使用这个代码:
require 'nokogiri'
f = File.open("test.xml")
doc = Nokogiri::XML(f)
nodes = doc.xpath("title")
nodes.each do |node|
print node.text
end
我得到的节点作为一个nil类。
要选择与选择器匹配的节点,请尝试:
nodes = doc.xpath("//title")
我会这样写代码:
require 'nokogiri'
doc = Nokogiri::XML(File.read("test.xml"))
nodes = doc.search("title")
puts nodes.map(&:text)
回到问题。您使用:
nodes = doc.xpath("title")
迫使Nokogiri将您的选择器解释为XPath,并将查找名为<title>
的<catalog>
的直接祖先。这是不存在的。相反,如果您想在整个文档中搜索任何<title>
标记,则需要使用//title
。
或者,如果你使用search
而不是强制使用xpath
, Nokogiri将决定你的意思是使用CSS选择器title
,它将正确工作,因为在CSS中,title
将搜索整个文档。
我建议使用CSS而不是XPath,因为它更具可读性。XPath非常强大,但是随着选择器变得越来越强大,它也很快聚集了大量的视觉噪音。