带有以下内容(注意第一行没有领先空间):
Test1@bigfoot.com
Test11@bigfoot.com
Test1111@bigfoot.com
Test111ew@bigfoot.com
Test12312@bigfoot.com
Test1231321@bigfoot.com
Test1342321@bigfoot.com
....
481 total rows
以下内容正确地删除了领先空间,但在每个字符串行之后插入一个空白行,并且每次执行每次执行时, truncates 总列表都随机数。
csvfile= open('list.csv','r')
csvfile1= open('complete_list.csv','w')
stripped = (row.strip() for row in csvfile)
reader = csv.reader(stripped,delimiter=' ')
writer= csv.writer(csvfile1)
for row in reader:
writer.writerow([e.strip() for e in row])
和:
with open('list.csv') as infile:
reader = csv.DictReader(infile)
fieldnames = reader.fieldnames
for row in reader:
row.update({fieldname: value.strip() for (fieldname, value) in row.items()})
什么都不做,因为假定第一行是字段名称,而实际上它只是...一行。
这里有几个问题:
- CSV文件必须在Python 3中使用
newline=""
以写入模式打开,否则它将插入Windows上的空白 - 不要在行上使用
strip
,而是使用lstrip
,否则它在行末端删除了Newline。会混淆CSV阅读器 - 使用
with
上下文块,以确保在退出块时关闭文件(最终应处理随机丢失的行)
我的建议:
with open('list.csv','r') as csvfile, open('complete_list.csv','w',newline="") as csvfile1: # newline="" to avoid blanks
stripped = (row.lstrip() for row in csvfile) # lstrip not strip
reader = csv.reader(stripped,delimiter=' ')
writer= csv.writer(csvfile1)
writer.writerows(reader) # don't overstrip: just write rows as-is