我正在使用Hpricot gem来解析xml。我可以得到标题和发布日期,但它不适用于链接。这是的代码片段
items = doc.search("//item").first(6)
items.each do |item|
feed = {}
feed[:title] = item.search("//title").text
feed[:link] = item.search("//link").text
feed[:published_date] = item.search("//pubdate").text
feeds << feed
end
生成的hpricot元素如下:
#<Hpricot::Elements[{elem <item> "ntt" {elem <title> "openagent.com.au" </title>} "ntt" {emptyelem <link>} "http://blog.iproperty.com.au/2016/03/22/openagent-com-au/" {bogusetag </link>} "ntt" {elem <comments> "http://blog.iproperty.com.au/2016/03/22/openagent-com-au/#comments" </comments>} "ntt" {elem <pubdate> "Mon, 21 Mar 2016 22:43:28 +0000" </pubDate>} "ntt"
我粘贴了开头的部分,因为这是唯一重要的部分。有人能说出它的解决方案吗?
items = doc.search("//item").first(6)
items.each do |item|
feed = {}
feed[:title] = item.search("//title").text
feed[:link] = item.search("//link").innerHTML
feed[:published_date] = item.search("//pubdate").text
feeds << feed
end
为了获得链接,我们可以使用innerHTML