我编写了一个脚本,将制表符分隔的矩阵(带标题)重新格式化为"长格式"。 请参阅下面的示例。 它正确地执行了任务,但它似乎陷入了无限循环......
输入示例:
WHO THING1 THING2
me me1 me2
you you1 you2
期望输出:
me THING1 me1
me THING2 me2
you THING1 you1
you THING2 you2
这是代码:
import csv
matrix_file = open('path')
matrix_reader = csv.reader(matrix_file, delimiter="t")
j = 1
while j:
matrix_file.seek(0)
rownum = 0
for i in matrix_reader:
rownum+=1
if j == int(len(i)):
j = False
elif rownum ==1:
header = i[j]
else:
print i[0], "t",header, "t",i[j]
j +=1
我认为这与我的退出命令有关(j = False)。有什么想法吗?
编辑:感谢您的建议。 我认为我最初发布的拼写错误导致了一些混乱,对此感到抱歉现在我采用了一个简单的解决方案:
valid = True
while valid:
matrix_file.seek(0)
rownum = 0
for i in matrix_reader:
rownum+=1
if j == int(len(i)):
valid = False
etc, etc, etc...
您的j += 1
在while
循环之外,因此j
永远不会增加。如果len(i)
永远不会小于 2,那么您将有一个无限循环。
但正如已经观察到的,这段代码还有其他问题。这是基于您的成语的工作版本。我会做很多不同的事情,但也许你会发现看看你的代码是如何工作的很有用的:
j = 1
while j:
matrix_file.seek(0)
rownum = 0
for i in matrix_reader:
rownum += 1
if j == len(i) or j == -1:
j = -1
elif rownum == 1:
header = i[j]
else:
print i[0], "t", header, "t", i[j]
j += 1
它不会按您想要的顺序打印行,但它可以正确处理基础知识。
这是我的做法。我看到这与Ashwini Chaudhary发布的内容相似,但更笼统一些:
import csv
matrix_file = open('path')
matrix_reader = csv.reader(matrix_file, delimiter="t")
headers = next(matrix_reader, '')
for row in matrix_reader:
for header, value in zip(headers[1:], row[1:]):
print row[0], header, value
>j+=1
在 while 循环之外,正如 senderle 的答案所说。
其他改进可以是:
-
int(len(i))
,只需使用len(i)
,因为len()
总是返回一个 int,所以不需要int()
它 - 使用
for rownum,i in enumerate(matrix_reader):
所以现在没有需要处理一个额外的变量rownum
,它会递增本身。
编辑:您的代码的工作版本,我认为这里不需要while
,for
循环就足够了。
import csv
matrix_file = open('data1.csv')
matrix_reader = csv.reader(matrix_file, delimiter="t")
header=matrix_reader.next()[0].split() #now header is ['WHO', 'THING1', 'THING2']
for i in matrix_reader:
line=i[0].split()
print line[0], "t",header[1], "t",line[1]
print line[0], "t",header[2], "t",line[2]