XPath数据从在线社区中抓取



我最近读了一篇关于如何使用Excel抓取Inbound.org社区成员档案的文章。如果你喜欢的话,你可以在这里看视频。

自从本教程发布以来,Inbound网站的结构发生了一些变化,正如你在视频中11点看到的那样,如果你试图复制社交媒体图标的XPath,它看起来会略有不同,因此我无法提取这些信息。

我现在得到的是:

/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i

这就是我在Excel中编写语法的方式:

=XPathOnUrl(A2,"//a[@class='twitter']","href")

然后像这样:

=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href")

尽管我尝试了很多不同的方式,但都没有向我显示该成员社交媒体个人资料的链接。

我甚至尝试用多种方式更改xpath以从页面中获得不同的数据,但都不是社交媒体信息:

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]")
=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1")

老实说,我不知道该怎么做了,出了点问题,我想不通。有没有人对此有足够的经验,或者可以用我的语法找出问题所在?

非常感谢

您尝试的第一个公式看起来不错,但这是适用于我的公式(SEO工具4.3.4版):

=Dump(XPathOnUrl(A2;"//a[@class='twitter']";"href";HttpSettings(TRUE)))

最新更新