>假设我有这样的XML:
<graph label="Test" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:cy="http://www.cytoscape.org" xmlns="http://www.cs.rpi.edu/XGMML" directed="1">
<foo>...</foo>
</graph>
第一个元素名称及其所有属性都显示在一行上。
我已经看到了如何使用lxml使用如下代码漂亮地打印元素树:
from lxml import etree
...
def prettyPrintXml(filePath):
assert filePath is not None
parser = etree.XMLParser(resolve_entities=False, remove_blank_text=True,
strip_cdata=False)
document = etree.parse(filePath, parser)
print(etree.tostring(document, pretty_print=True, encoding='utf-8'))
。但是使用它,每个元素都出现在一行上。
是否有一个神奇的咒语来告诉漂亮的打印机在元素属性之间插入换行符,例如,行长度不超过 80 个字符?
我希望结果看起来像这样:
<graph label="Test"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cy="http://www.cytoscape.org"
xmlns="http://www.cs.rpi.edu/XGMML" directed="1">
<foo>...</foo>
</graph>
ps:我不想诉诸subprocess
和xmllint
lxml
内置了一个漂亮的打印函数:这是一个教程,描述了几种打印XML的方法。不过,它有一些限制(根据lxml,xml规范中的限制)。
这个 stackoverflow 问题有几个答案,或多或少有黑客解决方案可以漂亮打印 xml,我认为您至少可以对基于正则表达式的答案进行建模以满足您的需求。
Fredrik Lundh(以ElementTree著称)对打印xml有一个非常低级的描述,你也可以自定义换行符和缩进属性。