当url不变时,Python web抓取



我正在使用python进行web抓取投影。我应该抓取这个网站(https://www.fec.gov/data/receipts/?committee_id=C00703975&two_year_transaction_period=2020&data_type=已处理(。我遇到的问题是,当你浏览数据时,url永远不会改变。我不知道该怎么办。根据我在抓取网站时的经验,url在切换页面时会发生变化,但这一个不会更改页面,它只是浏览同一页面上的数据。非常感谢。

这个网站处理大量数据,而且是动态的。在同一布局中,显示的数据将不断变化。解决问题的另一种方法(可能不是最好的(是导出数据并将其保存到暂存区,然后处理该数据。您可以定期刷新您的暂存区https://www.fec.gov/data/browse-data/?tab=bulk-数据

这大大减少了对抓取程序的需求,并使您能够专注于实际数据分析。

最新更新