小贝子编程

如何在Python中使用pandas pd.read_xml读取包含多个数据的xml标记

本文关键字：xml 读取包含多标记数据 read pd Python pandas python python-3.x pandas xml
更新时间 : 2023-09-21
英文 : How to read xml tag with multiple data using pandas pd.read_xml in Python?

我有以下玩具示例代码来使用pandas读取xml

xml = '''<?xml version='1.0' encoding='utf-8'?>
<data>
<d>10</d>
<d>20</d>
<d>11</d>
<d>2</d>
<d>5</d>
</data>'''
import pandas as pd
df = pd.read_xml(xml,xpath="//data")

结果

>>> df
d
0  5

它似乎只读取最后一个数据项。

预期结果

然而，我预计结果会出现以下DataFrame：

问题

是否可以使用pd.read_xml读取单个DataFrame中的所有d标签？

这不是pd.read_xml支持的用例。如果XPath生成以下形式的节点列表，效果最好：

<row>
<col1>...</col1>
<col2>...</col2>
<col3>...</col3>
</row>

您可以手动解析XML：

from xml.etree import ElementTree
xml = '''<?xml version='1.0' encoding='utf-8'?>
<data>
<d>10</d>
<d>20</d>
<d>11</d>
<d>2</d>
<d>5</d>
</data>'''
tree = ElementTree.fromstring(xml)
df = pd.DataFrame({
'd': [int(d.text) for d in tree.findall(".//d")]
})

如何在Python中使用pandas pd.read_xml读取包含多个数据的xml标记

结果

预期结果

问题

相关内容

最新更新

热门标签：