在python-panda中编写csv,需要更改列的顺序并添加空白列



我已经将一个csv文件导入到python中,并且我正在使用panda。我需要输出一个只包含部分数据的新csv文件,并以不同的顺序输出空白列。新的csv文件将用于将数据从一个系统导入,并且数据需要对齐。

因此,如果原始csv文件具有以下列

"date" "department" "name" "title" "employee id"

我需要csv文件的行来读取

"name",,,,,"department",,,,"date",,

我已经删除了我不需要的列:

del df["title"],def["employee id"]

我写了一堆空白的专栏:

df[a] = '';
df[b] = '';
df[c] = '';

当我按照我想要的顺序将它们写入csv时

df.to_csv('outfile.csv', cols=["name","a","b","c","department","d","e","f","date","g","h"], index=False,header=False)

出来了

date,department,,,,,,,,,,,name,,

我应该为这种特定类型的项目使用csv模块吗?我正在搜索文档,但很难弄清楚我所读的内容如何应用于我的任务

在我看来,reindex你的df会更容易,这会按照你想要的顺序排列列,在不存在列的地方放NaN值:

df.reindex(columns=["name","a","b","c","department","d","e","f","date","g","h"]‌​).to_csv('outfile.csv', index=False,header=False)

最新更新