<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
<td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>
我想提取"Illumina HiSeq 2500(Mus Musculus("。我使用了以下XPath代码:
//a[contains(., "GPL")]/following-sibling::td[1]/text()
文本后面的数字总是包含"GPL"。我可以选择"GPL17021",但当我寻找它之后的第一个td时,没有任何显示。
您的HTML示例并不完整,但看起来链接实际上是td
的子级,因此后面的td
不是兄弟。
请尝试以下操作以选择所需的节点:
//td[contains(a, "GPL")]/following-sibling::td[1]/text()