如何解析文件中的第二个xml树



假设我有一个类似的XML文件

<?xml version="1.0" encoding="utf-8"?>
<items>
  <?xml version="1.0" encoding="utf-8"?>
  <items>
    <item>
      <price>1500</price>
      <info> asfgfdff</info>
    </item>
  </items>

如何进行解析,以便解析器选择最近更新的xml树?

with open('file','r') as f:
    newestXml = []
    for line in f.readlines():
        if re.search('^<?xml',line):
            newestXml = [line]
        else:
            newestXml.append(line)

在循环结束时,newestXml将包含从<?xml最后一次出现到文件结束的所有行。现在,您可以组合这些行并使用xml解析器来解析xml。

注意-我现在不能检查这个代码,所以它可能包含一些小错误,但我希望这个想法能对你有所帮助。

最新更新