如何编写爬虫从instagram抓取数据



是否有任何方法可以抓取/监控instagram数据用于研究目的?

我尝试了官方的API,但它只在沙箱中工作,这是不可能爬行像追随者这样的真实信息。我需要监控某些账户,也扩大了追随者/追随者的范围,并跟踪他们的行为(例如点赞数的进展)

谁有什么建议?或者可以给我一些有关爬行任务的参考资料吗?

也许你可以尝试使用beautiful soup库并阅读Ryan Mitchell的这本书:Web抓取与Python。基本上,你应该了解DOM, regex以及如何通过算法跳转页面,这样你就可以开始了。

在你开始之前也要检查一个网站的ToS,知道他们可能有一些关于抓取的指导方针/规则,因为现在一般所有的网站都有robot.txt文件,指定你可以如何/哪些内容抓取

最新更新