从外部网页获取文本和图像



我读了很多关于如何在我们的外部网站(这是我们公司的内部内联网(中获取LinkedIn最新更新的文章。现在,任何用户都可以查看这些最近的更新。例如,如果有人访问我们的LinkedIn帐户(url类似于https://www.linkedin.com/company/OurCompany***),然后他们可以查看最近的更新,而无需登录LinkedIn。但LinkedIn似乎没有提供任何API,可以让我们获得这些最新更新,除非用户已经登录LinkedIn(这在我们的情况下不起作用(。此外,我还在搜索类似于RSS提要的内容,但LinkedIn似乎不提供任何RSS提要。。

所以我在想,如果我可以通过以下步骤获得这些最新更新:-

  1. 使用JavaScript获取我们LinkedIn帐户网页的源代码@https://www.linkedin.com/company/OurCompany***
  2. 然后获取最近更新的文本&图像标记
  3. 在我们的网站中显示文本和图像标记

所以我不确定以下3个步骤是否适用于我?

这将不起作用,因为浏览器内部的javascript不允许使用XHR对其他域进行HTTP请求,除非它们设置了Access-Control-Allow-Origin头,LinkedIn不会这样做,因为抓取它们的网页违反了它们的服务条款。

请参阅:跨来源资源共享(CORS(

最新更新