如何循环浏览csv文件的文件夹并读取每个文件的标题?然后在文件夹中输出



我是python的新手,需要这段代码的帮助。为了走到这一步,我做了很多搜索,但无法独自解决。提前感谢您的帮助。

我想做的是,我必须比较文件夹中的100多个csv文件,而不是所有文件都有相同的列数或列名。因此,我尝试使用python读取每个文件的标题,并将其放入csv文件中输出到文件夹中。

我走到了这一步,但甚至不确定我是否走上了正确的道路:

import pandas as pd
import glob
path = r'C:Usersuser1Downloads2016GAdata' # use your path
all_files = glob.glob(path + "/*.csv")
list1 = []
for filename in all_files:
df = pd.read_csv(filename, index_col=None, header=0)
list1.append(df)
frame = pd.concat(list1, axis=0, ignore_index=True)
print(frame)

谢谢你的帮助!

您可以创建一个字典,其键为filename,值为dataframe列。使用此字典创建数据帧的结果是文件名作为索引,列名作为列值。

d = {}
for filename in all_files:
df = pd.read_csv(filename, index_col=None, header=0)
d[filename] = df.columns
frame = pd.DataFrame.from_dict(d, orient='index')
0     1     2       3
file1  Fruit  Date  Name  Number
file2  Fruit  Date  Name    None

相关内容

  • 没有找到相关文章