我正在编写一个 XPath 表达式,我有一个奇怪的错误,我修复了这个错误,但是以下两个 XPath 表达式有什么区别?
"//td[starts-with(normalize-space()),'Posted Date:')]"
和
"//td[starts-with(normalize-space(text()),'Posted Date:')]"
主要是,第一个 XPath 表达式将捕获什么?因为我得到了很多奇怪的结果。那么text()
在匹配中会有什么作用呢?另外,如果我说normalize-space()
和normalize-space(.)
有区别吗?
好吧,真正的问题是:.
和text()
有什么区别?
.
是当前节点。如果你在需要字符串的地方使用它(即作为normalize-space()
的参数),引擎会自动将节点转换为节点的字符串值,对于一个元素来说,这是元素内的所有文本节点连接起来的。(因为我猜这个问题实际上是关于元素的。
另一方面,text()
仅选择作为当前节点的直接子节点的文本节点。
因此,例如给定XML:
<a>Foo
<b>Bar</b>
lish
</a>
假设<a>
是你的当前节点,normalize-space(.)
将返回Foo Bar lish
,但normalize-space(text())
将失败,因为text()
返回两个文本节点(Foo
和lish
)的节点集,normalize-space()
不接受。
长话短说,如果要规范化元素中的所有文本,请使用 .
。如果要选择特定的文本节点,请使用 text()
,但请始终记住,尽管它的名称,text()
返回一个节点集,该节点集仅在具有单个元素时才会自动转换为字符串。