我正在尝试从网站导入表,然后将数据转换为熊猫数据框。
网站是:https://en.wikipedia.org/wiki/list_of_postal_codes_of_canada:_m
到目前为止我的代码:
import numpy as np
import pandas as pd
import requests
from bs4 import BeautifulSoup
website_url = requests.get(
'https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M').text
soup = BeautifulSoup(website_url,'lxml')
My_table = soup.find('table',{'class':'wikitable sortable'})
for x in soup.find_all('table',{'class':'wikitable sortable'}):
table = x.text
print(My_table)
print(table)
打印的输出(my_table(
打印的输出(表(
如何将此网页表转换为熊猫数据框架?熊猫dataframe
您尝试过
是否尝试过pd.read_html()
?
另外,由于表是非常标准的,所以为什么不将表直接复制到Excel中并将其导入数据框架?