将内部tbody html内容转换为json

我正试图从网站获取web数据，我只需要从tbody类中获取内部html数据并将其转换为json，以便更好地控制，并在以后将数据保存到文件中。我只通过使用selenium中的find_element(by.XPATH(读取了每个元素。有没有什么方法可以读取整个innter html tbody内容，然后将其解析为json？请求不起作用，因为它在iframe中
网站和tbody是标题为"的滚动表；Tình hìnhdịch cảnước"；，我只想要表格减去标题，如果可能的话，还有表格的标题
读取元素的代码：

browser=webdriver.Firefox()
browser.get("https://covid19.gov.vn/")
time.sleep(3)
browser.switch_to.frame(browser.find_element(By.XPATH,'/html/body/div[1]/div[2]/div[3]/div/iframe'))
value=browser.find_element(By.XPATH,'/html/body/div[2]/div[1]/div/div[2]/div[1]/span[4]')
print(value.text)

只需调用页面所做的返回JSON的相同端点。

import requests
import pandas as pd
r = requests.get('https://static.pipezero.com/covid/data.json').json()
location_json = r['locations']
df = pd.DataFrame(location_json)
print(df)

相关内容

最新更新

热门标签：