在包含特定文本的元素之后提取整个同级元素


<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
<td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>

我想提取"Illumina HiSeq 2500(Mus Musculus("。我使用了以下XPath代码:

//a[contains(., "GPL")]/following-sibling::td[1]/text()

文本后面的数字总是包含"GPL"。我可以选择"GPL17021",但当我寻找它之后的第一个td时,没有任何显示。

您的HTML示例并不完整,但看起来链接实际上是td的子级,因此后面的td不是兄弟

请尝试以下操作以选择所需的节点:

//td[contains(a, "GPL")]/following-sibling::td[1]/text()

最新更新