所以我有这个网站:https://www.rad.cvm.gov.br/enetconsulta/frmgerenciapaginafre.aspx?numerosequencialosequencialdocumento = 60695
我要废弃以获取有关公司的公共信息。到目前为止,我已经设法写了:
driver = webdriver.Chrome()
driver.implicitly_wait(5)
base_url = urls[0] # which is equal to the above url
driver.get(base_url)
driver.find_element_by_id("ctl00_cphPopUp_cmbQuadro_cmbQuadro_Input").click()
driver.find_element_by_id("ctl00_cphPopUp_cmbQuadro_cmbQuadro_c0").click()
driver.find_element_by_id("ctl00_cphPopUp_cmbQuadro_cmbQuadro_Input").send_keys(u"Balanço Patrimonial Ativo")
如果您在网页上检查代码,则显示显示的表的ID为" CT100_CPHPOPUP",但是
driver.page_source
没有此ID。我出了什么问题,如何阅读该桌子?我想它在JavaScript运行后出现,但我不确定。如果是这样,我怎么知道要执行驱动程序的脚本是什么。Execute_script((?
预先感谢!
谢谢,但是过了一会儿,我找到了解决方案!我能够使用
来做到这一点driver.switch_to_frame(0)
很简单,不是吗?碰巧表格该表不在HTML(内部,外部或W/e(中,而是在单独的"帧"中。尽管我不知道这是什么意思,但它可能会对他人有所帮助:(