我最近读了一篇关于如何使用Excel抓取Inbound.org社区成员档案的文章。如果你喜欢的话,你可以在这里看视频。
自从本教程发布以来,Inbound网站的结构发生了一些变化,正如你在视频中11点看到的那样,如果你试图复制社交媒体图标的XPath,它看起来会略有不同,因此我无法提取这些信息。
我现在得到的是:
/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i
这就是我在Excel中编写语法的方式:
=XPathOnUrl(A2,"//a[@class='twitter']","href")
然后像这样:
=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href")
尽管我尝试了很多不同的方式,但都没有向我显示该成员社交媒体个人资料的链接。
我甚至尝试用多种方式更改xpath以从页面中获得不同的数据,但都不是社交媒体信息:
=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]")
=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1")
老实说,我不知道该怎么做了,出了点问题,我想不通。有没有人对此有足够的经验,或者可以用我的语法找出问题所在?
非常感谢
您尝试的第一个公式看起来不错,但这是适用于我的公式(SEO工具4.3.4版):
=Dump(XPathOnUrl(A2;"//a[@class='twitter']";"href";HttpSettings(TRUE)))