我已经将一个csv文件导入到python中,并且我正在使用panda。我需要输出一个只包含部分数据的新csv文件,并以不同的顺序输出空白列。新的csv文件将用于将数据从一个系统导入,并且数据需要对齐。
因此,如果原始csv文件具有以下列
"date" "department" "name" "title" "employee id"
我需要csv文件的行来读取
"name",,,,,"department",,,,"date",,
我已经删除了我不需要的列:
del df["title"],def["employee id"]
我写了一堆空白的专栏:
df[a] = '';
df[b] = '';
df[c] = '';
当我按照我想要的顺序将它们写入csv时
df.to_csv('outfile.csv', cols=["name","a","b","c","department","d","e","f","date","g","h"], index=False,header=False)
出来了
date,department,,,,,,,,,,,name,,
我应该为这种特定类型的项目使用csv模块吗?我正在搜索文档,但很难弄清楚我所读的内容如何应用于我的任务
在我看来,reindex
你的df会更容易,这会按照你想要的顺序排列列,在不存在列的地方放NaN
值:
df.reindex(columns=["name","a","b","c","department","d","e","f","date","g","h"]).to_csv('outfile.csv', index=False,header=False)