Importxml函数(googlesheets)不适用于Skillshare网站



我今天来这里是因为我在Googlesheets中使用ImportXML函数时遇到了一个奇怪的问题。

我正试图从两个网站的不同档案中提取hrefs(脸书、推特、youtube等(:udemy.com和skillshare.com。

我从我的个人资料中得到了我的目标,但从技能分享中没有运气。

经过多次尝试(即使使用奇怪的xpaths_query组合(,我相信问题可能是由两个原因引起的:1。网站在忽悠我(这可能吗?,2。我的xpath_query不正确(。。。然而,我仍然认为解决方案非常直接,但我看不出我会错过什么。

为了更好地理解,请访问我的Googlesheet和几个样本,你可以在那里找到更多的细节。。。

查看以下示例:良好结果>对于Udemy,我使用了以下谷歌表单功能

=IMPORTXML(";https://www.udemy.com/user/saddam-kassim-2/"quot//div[@class='instructor-profile--社交链接--3Kub5']/a/@href"(

N/A结果>对于Skillshare,我使用了以下谷歌表单功能

=IMPORTXML(";https://www.skillshare.com/user/sridhar"quot//div[@class='user-information-social-links']/a/@href"(

以下是html代码:UDEMY示例HTML

SKILLSHARE示例HTML

我真的很感激你的想法和想法。我做错了什么?我可以尝试什么?提前感谢!

链接在加载后由脚本填充,因此我们不能只使用XPATH。数据也位于初始文档的第三个脚本标记中。使用第一个Skillshare URL,我们可以构建以下公式:

=ArrayFormula(
IFNA(
REGEXEXTRACT(
SPLIT(
REGEXEXTRACT(
REGEXEXTRACT(
INDEX(
IMPORTXML(
"https://www.skillshare.com/user/profkarim",
"//script"
),
3
),
"socialLinks.*sections"
),
"({.*})"
),
"},{",
0,
1
),
"""url"":""?(.*?)""?,"
)
)
)

相关内容

最新更新