我正在使用lxml来尝试输出以下xml代码:
<annotation>
<folder>images</folder>
<filename>IMG_8111.JPG</filename>
<size>
<width>400</width>
<height>400</height>
</size>
<segmented>0</segmented>
<object>
<name>Bottle</name>
<bndbox>
<xmin>16</xmin>
<ymin>71</ymin>
<xmax>390</xmax>
<ymax>323</ymax>
</bndbox>
</object>
</annotation>
我使用本教程来学习如何实现 lxml 以满足我的需求。我面临的问题是我想要的输出有子元素到子元素。例如 - <annotation>
是我的主要元素,然后<folder>
、<filename>
和 <size>
是子元素,但随后,<height>
和 <width>' are subelements to the
' 子元素。我如何使用 lxml 实现这一目标。到目前为止,我有以下内容:
from lxml import etree
import xml.etree.cElementTree as ET
root = etree.Element("annotation")
etree.SubElement(root, "folder").text = "Child 1"
etree.SubElement(root, "filename").text = "Child 2"
size = etree.SubElement(root, "size").text = "Child 3"
etree.SubElement(size, "width").text = "Child 4"
with open ('xmltree.xml', 'wb') as f:
f.write(etree.tostring(root, pretty_print = True))
但它会引发以下错误:
etree.SubElement(size, "width").text = "Child 4"
TypeError: Argument '_parent' has incorrect type (expected lxml.etree._Element, got str)
请帮助我解决我做错了什么以及如何继续。
为了使size = etree.SubElement(root, "size").text = "Child 3"
按照您的预期进行评估,必须将其解释为:
(size = etree.SubElement(root, "size")).text = "Child 3"
在 Python 中,您无法在表达式中执行赋值。相反,Python 对此的解释是:
size = "Child 3"
etree.SubElement(root, "size").text = "Child 3"
您可以使用两个单独的行重写代码以实现所需的结果:
size = etree.SubElement(root, "size")
size.text = "Child 3"
在浏览了 lxml
API 后,它似乎不是一种在一行中同时创建元素并为text
属性分配值的方法。
变量大小具有类型字符串,因为它具有"子 3"值。你应该做:
size = etree.SubElement(root,"size")
size.text = "child 3"
etree.SubElement(size, "width").text="child 4"