小贝子编程

获取标记的文本和子标记的文本

本文关键字：文本获取 html xpath scrapy tags axes
更新时间 : 2023-09-21
英文 : Get text of a tag and the text of child tags

我有这个HTML

<p>
<strong>aquiline</strong>
<i> adj. </i>
of or like the eagle.
</p>

所有这些，这个节点都被div和class= field-item even包裹

我想背诵Aquiline adj. of or like the eagle...。现在我有了这个不正确的xpathresponse.xpath('//div[@class="field-item even"]//descendant-or-self::p/text()').getall()

您的xpath几乎是正确的。将p替换为*以选择所有文本节点，而不仅仅是段落标记的文本节点。同样使用normalize-space函数，您可以将所有文本作为一个字符串而不是列表。请参阅下面的代码片段。

response.xpath('normalize-space(//div[@class="field-item even"]//descendant-or-self::*)').get()

最新更新

c -如何用介子构建sdl2 ?
为什么在打字稿中给我错误?
ViewModel数据不会单独绑定到UserControl
如何使Qr码大小固定在ZPL无论内容?
为什么使用异步函数"getDownloadURL"来获取 Firebase Storage 中的文件网址
如何使用killtimer来完成Qtimer;
动态内联样式的值由sass变量
如何在matlab中找到一行等于矩阵中的向量?我特别想要有索引
使用命令行构建Xcode 14.3 Rosetta
类型"可分配给类型"T"的约束，但"T"可以使用约束"RGT"的不同子类型进行实例化
如何修改字符串值并将其转换为int, bool等?
TypeScript中的命令和响应泛型
Swift + Firestore:如何获取相关对象
创建shared_ptr类与私有析构函数?
按company_id筛选Laravel关系
Bash:向函数传递不同的参数列表
如何在文件系统Android 13上请求写入权限
按下ListView项目标题中的附件按钮
c -将结构体转换为uint8_t *或char *并通过字节流访问它是多么安全?
为什么从Oracle中的某个表读取比从同一数据库中的其他表读取慢
收到警告：名称"猜测"可以未定义
将每小时ERA5 netcdf文件合并为每日文件
打字脚本"TS2339：属性'X'在类型'Y'"错误中不存在，即使定义了类型
尝试添加背景音乐到web应用程序
构建错误.在scala框架中使用PlayScala
Ruby on Rails -从数组中获取前n个元素
没有更多的数据!现在，刮痧将会停止.不能使用twint获取更多tweets
为什么我不能在空对象上调用方法view()
Python类和协议的多重继承
正在写IIS重定向规则

获取标记的文本和子标记的文本

相关内容

最新更新

热门标签：