将不完整的嵌套列表放入矩形数组中



在Python中(也使用numpy),我有一个列表的列表,每个列表的长度不同。

[
    [
         ["header1","header2"],
         ["---"],
         [],
         ["item1","value1"]
    ],
    [
         ["header1","header2","header3"],
         ["item2","value2"],
         ["item3","value3","value4","value5"]
    ]
]

我想让这个数据结构是矩形的:即保证len(list[x])对所有x都是常数,len(list[x][y])对所有x,y等都是常数。

(这是因为我想将数据结构导入numpy)

我可以想到各种非python的方法来做这样的事情(迭代结构,记录每个级别的最大长度,使用None进行第二次传递和填充值,但必须有更好的方法。

(我也希望解决方案不依赖于结构的维度;也就是说,它也应该在这样的结构列表上工作…)

有一个简单的方法做到这一点,我错过了吗?

您可以创建一个具有所需尺寸的ndarray,并方便地读取您的列表。因为你的列表是不完整的,你必须捕获IndexError,这可以在try / exception块中完成。

使用numpy.ndenumerate可以很容易地将解决方案扩展到更多维度(在下面的for循环中添加更多索引i,j,k,l,m,n,...):

import numpy as np
test = [ [ ["header1","header2"],
           ["---"],
           [],
           ["item1","value1"] ],
         [ ["header1","header2","header3"],
           ["item2","value2"],
           ["item3","value3","value4","value5"] ] ]

collector = np.empty((2,4,4),dtype='|S20')
for (i,j,k), v in np.ndenumerate( collector ):
    try:
        collector[i,j,k] = test[i][j][k]
    except IndexError:
        collector[i,j,k] = ''

print collector
#array([[['header1', 'header2', '', ''],
#        ['---', '', '', ''],
#        ['', '', '', ''],
#        ['item1', 'value1', '', '']],
#       [['header1', 'header2', 'header3', ''],
#        ['item2', 'value2', '', ''],
#        ['item3', 'value3', 'value4', 'value5'],
#        ['', '', '', '']]],  dtype='|S10')

相关内容

  • 没有找到相关文章

最新更新