如何合并和格式化多个 csv 文件中的列元素并将其转储到新的 csv 文件中



>我有多个CSV文件。它们都具有单个 id 列

在 A.csv

ID
---
01487
01986
01478

在B.csv

ID
---
01578
01568
01478

我想从这些 CSV 文件创建一个 CSV,其中 c.csv

ID
----
01487
01986
01478
01578
01568
01478 

我已经看到按列连接,但我希望我的所有 id 一个接一个地在同一列中。 我见过熊猫串联,但不能像这样格式化。任何基于python熊猫的解决方案或shell命令解决方案都受到赞赏

在 shell 中使用以下代码:

cat a.csv >> c.scv
tail -n 2 b.csv >> c.csv
你能试试下面吗
import os
import glob
import pandas as pd
os.chdir("/mydir")
def merge_all_csv(extension='csv',final_file_name="final_csv"):
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
#combine all files in the list
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames ])
#export to csv
return combined_csv.to_csv( final_file_name, index=False, encoding='utf-8-sig')
merge_all_csv()

最新更新