如何解析文件中的第二个xml树

假设我有一个类似的XML文件

<?xml version="1.0" encoding="utf-8"?>
<items>
  <?xml version="1.0" encoding="utf-8"?>
  <items>
    <item>
      <price>1500</price>
      <info> asfgfdff</info>
    </item>
  </items>

如何进行解析，以便解析器选择最近更新的xml树？

with open('file','r') as f:
    newestXml = []
    for line in f.readlines():
        if re.search('^<?xml',line):
            newestXml = [line]
        else:
            newestXml.append(line)

在循环结束时，newestXml将包含从<?xml最后一次出现到文件结束的所有行。现在，您可以组合这些行并使用xml解析器来解析xml。

注意-我现在不能检查这个代码，所以它可能包含一些小错误，但我希望这个想法能对你有所帮助。

相关内容

最新更新

热门标签：