我正试图从Facebook上抓取帖子和评论,我正在使用Beautifulsoup。
我得到的部分:
url = 'https://www.facebook.com/ameedcoffee'
response=requests.get(url)
soup = BeautifulSoup(response.text,'html.parser')
但是,当我试图捕获任何div标记时,我得到len=0,就好像这些div标记不存在一样
cards= soup.find_all('div','kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q')
len(cards)
我对硒不熟悉,这只是我的第二份工作。你能帮我理解我做错了什么吗?如果我要使用selenium,如何开始代码?
Facebook使用了一个名为(ReactJS(的框架,它使动态类名像";"xzx_sdsd-sds";每次发布新版本时,它们都会发生变化。
也许如果你想废弃,你可能不得不爬到廉价手机上的Facebook纯HTML版本。它曾经在https://m.facebook.com但事情可能已经改变了