如何在CSV文件中删除一些额外的逗号有时有3个或更多额外的逗号,我希望标记的部分成为一个单列
正确的格式是11列,我只是想找到那些不是,并删除逗号
84,855,648857,8787548,R,mark,one 55, power
,0000081,3434,59190000,defen, 6,
前5列和后5列是静态的,只有中间会成为一个单独的列,有时会有超过3个额外的列
现在我分割了300 GB的文件,以便与python脚本在循环中工作,因此有一个文件夹包含文件
结果应该是这样的
84,855,648857,8787548,R,mark one 55 power,0000081,3434,59190000,defen,six,
我建议将csv数据读入一个列表,合并它们,然后写回去:
def merge(data):
result = []
result += data[:5]
temporary = ""
for item in data[5:-5]:
temporary += item + " "
result.append(temporary[:-1])
result += data[-5:]
return result
这个函数接受一个列表,start(包含),end(不包含),它合并指定的范围并返回结果。例如,调用
merge(["84","855","648857","8787548","R","mark","one 55","power","0000081","3434","59190000","defen","six"])
将合并索引5,6,7,并返回:
['84', '855', '648857', '8787548', 'R', 'mark one 55 power', '0000081', '3434', '59190000', 'defen', 'six']
你可以把列表写回csv文件