我是xml解析的新手。我有一个xml文件,其中包含一个内容和一个已标识的实体(人员和位置(。";人;文件中的实体接近10;位置";只有3。
<em>
Mad Max:
<location>Fury Road</location
</em>
等等。。
我想提取xml文件中存在的每个实体的内容、开始位置和结束位置(使用Python-for循环(。但不确定如何开始编写代码以从xml文件中获取它的位置。
有人能帮帮我吗?
您可以在Python中使用内置的xml模块,而不是使用常规的for循环(这可能会在将来导致问题(。
在您的示例中:
import xml.etree.ElementTree as ET
tree = ET.parse(xmlfile)
root = tree.getroot()
从这里,您可以获得职位,或者简单地使用这个模块,而不是您计划对xml数据进行的任何操作。