从 n×2 numpy 数组填充排序的 LIst

我有一个numpy阵列，带有形状n×2，一堆长度为2的元素，我想传输到sortedlist。因此，目标是创建一个具有长度为2的整数元组的排序列表。

问题在于，SortedList的构造函数检查每个条目的真实价值。这适用于一维数组：

In [1]: import numpy as np
In [2]: from sortedcontainers import SortedList
In [3]: a = np.array([1,2,3,4])
In [4]: SortedList(a)
Out[4]: SortedList([1, 2, 3, 4], load=1000)

但是，对于两个维度，当每个条目都是数组时，没有明确的真实价值，而排序列表是不合作的：

In [5]: a.resize(2,2)
In [6]: a
Out[6]: 
array([[1, 2],
       [3, 4]])
In [7]: SortedList(a)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-7-7a4b2693bb52> in <module>()
----> 1 SortedList(a)
/home/me/miniconda3/envs/env/lib/python3.6/site-packages/sortedcontainers/sortedlist.py in __init__(self, iterable, load)
     81 
     82         if iterable is not None:
---> 83             self._update(iterable)
     84 
     85     def __new__(cls, iterable=None, key=None, load=1000):
/home/me/miniconda3/envs/env/lib/python3.6/site-packages/sortedcontainers/sortedlist.py in update(self, iterable)
    176         _lists = self._lists
    177         _maxes = self._maxes
--> 178         values = sorted(iterable)
    179 
    180         if _maxes:
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

我目前的解决方法是手动将每一行转换为元组：

sl = SortedList()
for t in np_array:
    x, y = t
    sl.add((x,y))

但是，该解决方案提供了一些改进的空间。有人知道如何解决此问题而不明确将所有阵列打包到元组中？

问题不是要检查阵列的真实价值，而是它们被比较，以便可以对其进行排序。如果您在数组上使用比较操作员，则会返回数组：

>>> import numpy as np
>>> np.array([1, 4]) < np.array([2, 3])
array([ True, False], dtype=bool)

这个由此产生的布尔数组实际上是由sorted检查的真相值的数组。

另一方面，使用元组（或列表）的相同操作将通过元素比较来进行元素，并返回单个布尔值：

>>> (1, 4) < (2, 3)
True
>>> (1, 4) < (1, 3)
False

因此，当SortedList尝试在numpy数组序列上使用sorted时，它无法进行比较，因为它需要单个布尔值才能通过比较操作员返回。

抽象的一种方法是创建一个新的数组类，该类实现比较运算符，例如__eq__，__lt__，__gt__等，以重现元组的排序行为。具有讽刺意味

class SortableArray(object):
    def __init__(self, seq):
        self._values = np.array(seq)
    def __eq__(self, other):
        return tuple(self._values) == tuple(other._values)
        # or:
        # return np.all(self._values == other._values)
    def __lt__(self, other):
        return tuple(self._values) < tuple(other._values)
    def __gt__(self, other):
        return tuple(self._values) > tuple(other._values)
    def __le__(self, other):
        return tuple(self._values) <= tuple(other._values)
    def __ge__(self, other):
        return tuple(self._values) >= tuple(other._values)
    def __str__(self):
        return str(self._values)
    def __repr__(self):
        return repr(self._values)

使用此实现，您现在可以对SortableArray对象的列表进行排序：

In [4]: ar1 = SortableArray([1, 3])
In [5]: ar2 = SortableArray([1, 4])
In [6]: ar3 = SortableArray([1, 3])
In [7]: ar4 = SortableArray([4, 5])
In [8]: ar5 = SortableArray([0, 3])
In [9]: lst1 = [ar1, ar2, ar3, ar4, ar5]
In [10]: lst1
Out[10]: [array([1, 3]), array([1, 4]), array([1, 3]), array([4, 5]), array([0, 3])]
In [11]: sorted(lst1)
Out[11]: [array([0, 3]), array([1, 3]), array([1, 3]), array([1, 4]), array([4, 5])]

这可能对您需要的东西过大，但这是一种方法。无论如何，您都不会在一系列不会在比较时返回单个布尔值的对象上使用sorted。

如果您所追求的一切避免了for循环，则可以将其替换为列表理解（即SortedList([tuple(row) for row in np_array])）。

相关内容

最新更新

热门标签：