假设我有一个类似的XML文件
<?xml version="1.0" encoding="utf-8"?>
<items>
<?xml version="1.0" encoding="utf-8"?>
<items>
<item>
<price>1500</price>
<info> asfgfdff</info>
</item>
</items>
如何进行解析,以便解析器选择最近更新的xml树?
with open('file','r') as f:
newestXml = []
for line in f.readlines():
if re.search('^<?xml',line):
newestXml = [line]
else:
newestXml.append(line)
在循环结束时,newestXml
将包含从<?xml
最后一次出现到文件结束的所有行。现在,您可以组合这些行并使用xml解析器来解析xml。
注意-我现在不能检查这个代码,所以它可能包含一些小错误,但我希望这个想法能对你有所帮助。