我正在使用HTMLAgilityPack
来解析网站的HTML。
问题是:There are two nodes with class "price"
。我可以通过检查DOM
来区分它们。所以3级以上,我想要的价格有product-top
类的父节点,而我不想要的节点有advertisement
类以上3级。
像这样:
<div class="product-top">
<div class="xy">
<div class="zz">
<div class="price">THIS IS WHAT I WANT>
close all
<div class="advertisement">
<div class="xy2">
<div class="zz2">
<div class="price">THIS IS WHAT I DO NOT WANT>
close all
如何使用C#中的HTMLAgilityPack
访问第一个示例中的Node?
提前感谢
您可以使用以下XPath表达式:
//div[@class='product-top']//div[@class='price']
或者,如果你想要3个以上级别:
//div[@class='product-top']/div/div/div[@class='price']