亲爱的,我需要转换政府网页中的新冠肺炎住院json数据:https://onemocneni-aktualne.mzcr.cz/covid-19#panel3-住院
我查看了网页,发现下面的表格显示了html代码。
我使用了以下Python代码,得到了以下结果:
import bs4 as bs
import urllib.request
import json
source = urllib.request.urlopen("https://onemocneni-aktualne.mzcr.cz/covid-19#panel3-hospitalization")
soup = bs.BeautifulSoup(source)
js_test = soup.find("div", id="js-hospitalization-table-data")
#Convert to JSON object
jsonData = json.loads(js_test.attrs["data-table"])
print (jsonData['body'])
谢谢。
您想要的数据是JSON格式的,您可以将其转换为Python字典(dict
(,并使用内置的json
模块获取body
键下的数据。
import json
import bs4 as bs
import urllib.request
source = urllib.request.urlopen(
"https://onemocneni-aktualne.mzcr.cz/covid-19#panel3-hospitalization"
)
soup = bs.BeautifulSoup(source, "html.parser")
json_data = json.loads(
soup.find("div", id="js-hospitalization-table-data")["data-table"]
)
print(type(json_data))
print(*json_data["body"])
输出(部分(:
<class 'dict'>
['01.03.2020', 0, 0, 0, 0, 0] ['02.03.2020', 0, 0, 0, 0, 0] ... ['20.12.2020', 4398, 588, 0.1337, 34796, 0.7152]