将几个抓取的表导出到一个CSV文件中



如何将从几个HTML中读取的表连接起来?我知道它们被认为是列表,列表是不可能连接的,但是我如何将从不同URL抓取的多个表插入到一个CSV中呢?什么好主意吗?是否有可能将打印输出保存在一个变量中,然后将其移动到CSV中?

import pandas as pd
df = pd.read_html('URL')
df1 = pd.read_html('URL')
print(df, df1)
(**df,df1**).to_csv('name.csv')

属性(df,df1))当然是不正确的,只是写它来描述我所缺少的东西。

提前谢谢你

Read_html返回一个数据帧列表。所以,如果你确定列表中包含的数据帧格式可以被连接你可以将它们合并成一个数据帧,然后导出到csv:

import pandas as pd
dframes_list1 = pd.read_html('URL1')
dframes_list2 = pd.read_html('URL2')
dframes_all = dframes_list1 + dframes_list2
consolidated_dframe = pd.concat(dframes_all)
consolidated_dframe.to_csv('name.csv')

相关内容

最新更新