小贝子编程

获取在xml中找到的命名实体的起始位置和结束位置

我是xml解析的新手。我有一个xml文件，其中包含一个内容和一个已标识的实体(人员和位置(。"；人；文件中的实体接近10；位置"；只有3。

<em>
Mad Max:
<location>Fury Road</location 
</em>

等等。。

我想提取xml文件中存在的每个实体的内容、开始位置和结束位置(使用Python-for循环(。但不确定如何开始编写代码以从xml文件中获取它的位置。

有人能帮帮我吗？

您可以在Python中使用内置的xml模块，而不是使用常规的for循环(这可能会在将来导致问题(。

在您的示例中：

import xml.etree.ElementTree as ET
tree = ET.parse(xmlfile)
root = tree.getroot()

从这里，您可以获得职位，或者简单地使用这个模块，而不是您计划对xml数据进行的任何操作。

相关内容