像(FB,TWITTER)一样登录网站并用c#抓取数据



我正在c#(visualstudio)中创建一个控制台应用程序。但我不知道从哪里开始。首先我想登录(phantomjs或selenium)>>然后转到(指定的)网站URL并提取html?我想知道如何在我的网络请求中保存登录信息。非常感谢。

长话短说,仅通过web请求实现这一点并不容易,因为每个网站都有自己的cookie和安全管理方式。

如果您使用web浏览器控件首先登录,会更容易。从那里,浏览器可以获得一个有效的cookie,您可以从那里开始抓取数据。

我在Chegg网站上也做过类似的事情。有关详细信息,您可以查看我的存储库https://github.com/hungqcao/chegg-solutions-saver

在你的情况下,它可能会变得有点复杂,因为FB、Twitter可能有双因素身份验证或类似的东西,但想法保持不变。

如果你需要帮助,请告诉我。

最新更新