我试图使用nokogiri来解析我的XML,这是我从URL中获得的,但是我无法创建一个数组项目。
我的XML:
<component name="Hero">
<topic name="i1">
<subtopic name="">
<links>
<link Dur="" Id="" type="article">
<label>I am here First. </label>
<topic name="i2">
<subtopic name="">
<links>
<link Dur="" Id="" type="article">
<label>I am here Fourth. </label>
<label>I am here Sixth. </label>
<topic name="i3">
<subtopic name="">
<links>
<link Dur="" Id="" type="article">
<label>I am here Fourth. </label>
我打算为每个主题创建一个数组,其中包含其中的标签。例如:
hro_array = ["我在这里。","我在这里。","我在这里"。
假设您的XML形成良好且有效(嵌套标签的正确关闭等),那么您只需要获取URL的内容(例如使用内置open-uri
),然后使用XML解析技术(例如XPath)检索所需数据。
例如,假设您想要一个嵌套标签列表的主题名称:
require 'open-uri'
require 'nokogiri'
def topic_label_hash(doc)
doc.xpath('//topic').each_with_object({}) do |topic, hash|
labels = topic.xpath('.//label/text()').map(&:to_s)
name = topic.attr('name')
hash[name] = labels
end
end
xml = open(my_url)
doc = Nokogiri::XML(xml)
topic_label_hash(doc) # =>
# {
# "TV" => [
# "I am here First. ",
# "I am here Second. ",
# "I am here Third. ",
# ...
# ],
# "Internet" => [
# "I am here Fourth. ",
# "I am here Fifth. ",
# "I am here Sixth. "
# ],
# ...
# }