小贝子编程

LXML 在第一个嵌套标记处剪切文本

本文关键字：文本第一个嵌套 LXML lxml
更新时间 : 2023-09-14
英文 : LXML cuts text at the first nested tag

请看一下这个代码：

# -*- coding: utf-8 -*-
from lxml import etree
html_fragment = "<body><p>This is html, you can <a href='wikpedia'>learn more</a> on the wikipedia page</p></body>"
tree = etree.fromstring(html_fragment, etree.HTMLParser())
for x in tree.findall(".//p") :
print(x.text)

此打印：

This is html, you can

它剪切a标签之前的文本。如何获取p标签的所有文本？

找到解决方案：必须使用.text_content((而不是.text

。LXML 官方文档

最新更新

Default如何将create_function更改为匿名函数?
Pandas组按行数百分比排序
从Word文档转换为PDF，显示错误的标题
UE4 -对特定角色施加伤害
堆栈中的帧指针是什么?这个框架到底是什么?(汇编中的堆栈)
如何使string.strip()剥离多个字符?
Git 连接问题。 "fatal: unable to connect to github.com....."
使用SingleStore连接两个带有整数字符串的表
将用户输入的值替换为React中由状态分配的值
如何从JSchema获取父对象名称/映射JsonObjects到新的父对象
为pandas数据框架列添加字符串，其中包含多个逗号分隔值
我试图在python中创建一个虚拟环境，但我得到错误:未能找到内置解释器python_spec=python3.5的发现
Spark 相当于 postgres json 函数 ->
API 无法处理我的请求，因为模板文字使 API 动态化
如何在VBA中引用UserForm中文本框的值?
获取(count(column1) + count(column2))的和
Cypress -如何使用Cypress命令验证PDF文件中的数据
JS reduceRight是导致数组成为对象，我怎么能修复逻辑?
是否有办法在SQL中创建一个临时2d数组?
如何使用特定列中的id在R中绑定data.frames
如何隐藏源代码，而我运行react-app-rewired构建和react-app-rewired启动
React native检测设备是否是RTL
AWS CLI "$ aws configure"创建 .awsconfig 和 .awscredentials 文件，而不是 .aws/config 和 .aws/credenatials
如何运行bash脚本与目标?
在Discord.py中发送嵌入消息的顺序
从列表中删除重复项，不包括开始和结束
从索引和值点创建矩阵
MongoDB:在$group之后使用$setWindowFields
无法用聚合填充和构建文档
如何将应用程序池分配给不同的ASP.Net Core网站在AWS Elastic Beanstalk?

LXML 在第一个嵌套标记处剪切文本

相关内容

最新更新

热门标签：