小贝子编程

用panda从复杂xml文档中提取文本元素

本文关键字：提取取文本元素文档 xml panda 复杂 python xml pandas
更新时间 : 2023-09-19
英文 : Extracting text element from complex xml document with pandas

我对python和panda很陌生，我正试图从xml中提取一个文本元素，其结构如下：

在此处输入图像描述

我试图做的是提取

中块class＝"下的文本；全文；并将其保存在单独的文件中。我试过一些方法，但到目前为止都没有效果。有人能帮我吗？复杂的结构让我抓狂。

file_output = open('my_new_file.txt', 'w')
flag = False
with open('my_xml_file.xml') as f:
for line in f:
if flag and '</block>' in line:
flag = False
if flag:
file_output.write(line.rstrip('</p>').lstrip('<p>') + 'n')
if 'class="full_text"' in line:
flag = True
file_output.close()

最新更新

向新分支添加一个文件夹
如何获取按实例类型和日期划分的AWS EC2/Sagemaker实例使用时间?
在同一台主机上拥有多个Kafka分区的目的是什么
Unity停止使用字符串生成器编辑代码
JavaScript post请求错误422与FastApi python服务器
Java泛型歧义，问题是什么?
对象作为react组件是无效的.(找到:键为{}的对象).如果您打算呈现子集合，请使用数组代替 &g
去掉前因子，不改变其余的表达式
如何使用flutter实现女性body部位的选择?
动态更改方法调用，不使用case语句
SyncFusion Flutter Gauge
奥利凡德的库存挑战：在 Mysql 编译器中显示语法错误时出错 row_number() over(分区依据 )
带不透明度的颤振动画可见性
发布添加过渡效果的div显示隐藏功能
多个小部件使用的ReorderableListViewChildGlobalKey
如何在<span>包含中<a>获取文本
在BigQuery中过滤多个条件的代码
是否有一种方法可以在Sveltekit中以编程方式创建路由?
Django模板-如何在子对象的forloop中显示子对象为null时显示父对象
如何处理在另一个屏幕中获取的数据?
当输入有效的成员号时未执行返回语句
检查两个字符串的相等性在javascript中不能正常工作
使用laravel从数组中获取值
升级到Expo SDK 48.0.10后，应用卡在启动界面
如何创建一个循环，输出给定的列表(包括数字)
所有的酒吧/蜡烛都在粉刷
这个字段是Django的哪个字段以及如何使用它?
使用# id更改HTML模板中的JS代码值
Regex语句，用于捕获最外层括号内的元素
如何在用户猜测/输入后更改占位符?

用panda从复杂xml文档中提取文本元素

相关内容

最新更新

热门标签：