获取在xml中找到的命名实体的起始位置和结束位置



我是xml解析的新手。我有一个xml文件,其中包含一个内容和一个已标识的实体(人员和位置(。";人;文件中的实体接近10;位置";只有3。

<em>
Mad Max:
<location>Fury Road</location 
</em>

等等。。

我想提取xml文件中存在的每个实体的内容、开始位置和结束位置(使用Python-for循环(。但不确定如何开始编写代码以从xml文件中获取它的位置。

有人能帮帮我吗?

您可以在Python中使用内置的xml模块,而不是使用常规的for循环(这可能会在将来导致问题(。

在您的示例中:

import xml.etree.ElementTree as ET
tree = ET.parse(xmlfile)
root = tree.getroot()

从这里,您可以获得职位,或者简单地使用这个模块,而不是您计划对xml数据进行的任何操作。

相关内容

  • 没有找到相关文章

最新更新