我需要处理一个文件,该文件是一个带有管道分隔值的csv。问题是,在像这样的几个空行之后,很少有行具有其前一个值
"xx"|"yyyyy"|"zzz"|"aaaaaaaa"|"bbbbbbb"|"cccccccc"|"dddd"|"eeeeeee"|"fffffffffff
ffff"|""|""|"iiiii"
我不明白如何将其作为一行处理。现在我正在读取csv文件作为:
with open(r".sample.csv","r") as f:
for line in f:
yield line
你知道如何解决这个问题吗?我需要将多行中的那一行作为一行处理,而不是所有行的格式都是这样的。
PS:我使用多处理来处理这个CSV。
csv
模块知道如何处理此问题。不要不必要地重新发明它。
with open("./sample.csv","r") as f:
for line in csv.reader(f, delimiter="|"):
yield line
csv.reader
返回已解析的字段序列,而不是空行。