我在Ruby中使用Nokogiri编写了一个SAX解析器,我正在解析一个非常大的xml文件。奇怪的是,使用
data.each do |node|
if (node.name == "product" && node.node_type == Nokogiri::XML::Reader::TYPE_ELEMENT)
#puts p.inspect
p = Nokogiri::XML.parse(node.outer_xml)
#puts p.xpath("//xmlns:step-quantity").text
images = []
sizes = []
colors = []
# If product is a master
if p.xpath('//xmlns:image-group[@view-type="re_detail"]/xmlns:image/@path').count != 0
# Product ID
product_id = p.xpath('//@product-id').text # <--- THIS
返回
hbeu5010140440462983591054046298359112404629835912940462983591364046298359143404629835915040462983591674046298359174
对于 XML
<product product-id="hbeu50101404">
<ean/>
<upc/>
<unit/>
<min-order-quantity>1</min-order-quantity>
<step-quantity>1</step-quantity>
我不明白为什么?我只会削减字符串长度,但有些 ID 更长,我觉得那种脏。有人可以帮我吗?:-)
提前致谢
本杰明
抱歉,答案很简单:我还有其他属性,带有像<variation>
这样的product-id="hbeu50101404"
,这就是为什么它收集了字符串中的所有内容-.-