我有一个CSV类型的文件,它的头和值在同一段中,如下所示:
"field1=value1", "field2=value2", etc
是否有办法将字段拉到标题和值作为下面的行?我现在有:
df = pd.read_csv(file, sep='=')
df.to_csv(file + ".csv", index=None)
上面的输出是:
field1=value1, field2 value2, etc
我想要的输出:
field1, field2, etc
value1, value2, etc
value, value, etc
提前感谢!
你可以尝试这样做:
import csv
data = []
fieldnames = set()
with open('input.csv') as f_input:
csv_input = csv.reader(f_input, skipinitialspace=True)
for row in csv_input:
d_row = {}
for entry in row:
if entry: # skip empty entries
key, value = entry.split('=')
d_row[key] = value
fieldnames.add(key)
data.append(d_row)
with open('output.csv', 'w', newline='') as f_output:
csv_output = csv.DictWriter(f_output, fieldnames=sorted(fieldnames))
csv_output.writeheader()
csv_output.writerows(data)
或创建一个数据框架:
df = pd.DataFrame(data, columns=sorted(fieldnames))
print(df)
使用标准csv.reader()
读取每一行,然后将每个字段拆分为键值对并存储到行字典中,然后将行字典添加到data
中。集合用于学习所有正在使用的字段名。
如果你输入的CSV文件是:
"field1=value1","field2=value2"
"field1=value3","field2=value4"
output.csv
文件应该是:
field1,field2
value1,value2
value3,value4