在Python中(也使用numpy),我有一个列表的列表,每个列表的长度不同。
[
[
["header1","header2"],
["---"],
[],
["item1","value1"]
],
[
["header1","header2","header3"],
["item2","value2"],
["item3","value3","value4","value5"]
]
]
我想让这个数据结构是矩形的:即保证len(list[x])
对所有x
都是常数,len(list[x][y])
对所有x,y等都是常数。
(这是因为我想将数据结构导入numpy)
我可以想到各种非python的方法来做这样的事情(迭代结构,记录每个级别的最大长度,使用None
进行第二次传递和填充值,但必须有更好的方法。
(我也希望解决方案不依赖于结构的维度;也就是说,它也应该在这样的结构列表上工作…)
有一个简单的方法做到这一点,我错过了吗?
您可以创建一个具有所需尺寸的ndarray
,并方便地读取您的列表。因为你的列表是不完整的,你必须捕获IndexError
,这可以在try / exception
块中完成。
使用numpy.ndenumerate
可以很容易地将解决方案扩展到更多维度(在下面的for循环中添加更多索引i,j,k,l,m,n,...
):
import numpy as np
test = [ [ ["header1","header2"],
["---"],
[],
["item1","value1"] ],
[ ["header1","header2","header3"],
["item2","value2"],
["item3","value3","value4","value5"] ] ]
collector = np.empty((2,4,4),dtype='|S20')
for (i,j,k), v in np.ndenumerate( collector ):
try:
collector[i,j,k] = test[i][j][k]
except IndexError:
collector[i,j,k] = ''
print collector
#array([[['header1', 'header2', '', ''],
# ['---', '', '', ''],
# ['', '', '', ''],
# ['item1', 'value1', '', '']],
# [['header1', 'header2', 'header3', ''],
# ['item2', 'value2', '', ''],
# ['item3', 'value3', 'value4', 'value5'],
# ['', '', '', '']]], dtype='|S10')