添加由另一个数组索引的数组的重复元素



我有一个相对简单的问题,如果不使用循环,我无法解决。我很难算出这道题的正确题目。假设我们有两个numpy数组:

array_1 = np.array([[0, 1, 2],
[3, 3, 3],
[3, 3, 4],
[3, 6, 2]])
array_2 = np.array([[0, 0, 0], 
[1, 1, 1],
[2, 2, 2],
[3, 3, 3],
[4, 4, 4],
[5, 5, 5],
[6, 6, 6]])

array_1表示array_2中我们想要sum的行的索引。因此,例如,result数组中的第4行应该包含array_2中与array_1中的所有3具有相同行索引的所有行的总和。

在代码中理解它要容易得多:

result = np.empty(array_2.shape)
for i in range(array_1.shape[0]):
for j in range(array_1.shape[1]):
index = array_1[i, j]
result[index] = result[index] + array_2[i]

结果应该是:

[[ 0  0  0]
[ 0  0  0]
[ 3  3  3]
[10 10 10]
[ 2  2  2]
[ 0  0  0]
[ 3  3  3]]

我尝试使用np.einsum,但我需要使用数组中的两个元素作为索引,也需要使用它的行作为索引,所以我不确定np.einsum是否是这里的最佳路径。

这就是我在图形方面遇到的问题。array_1表示三角形的顶点的索引,array_2表示其中行的索引对应于顶点的索引的法线

任何时候从重复索引中添加东西时,像np.add这样的普通ufunc都不会开箱即用,因为它们只处理一次重复的花式索引。相反,您必须使用无缓冲的版本,即np.add.at

这里,您有一对索引:array_1中的行是array_2中的行索引,array_1中的元素是输出的行索引。

首先,将索引明确地构造为花式索引。这将使它们的使用更加简单:

output_row = array_1.ravel()
input_row = np.repeat(np.arange(array_1.shape[0]), array_1.shape[1]).ravel()

您可以将input_row直接应用于array_2,但需要add.at才能使用output_row:

output = np.zeros_like(array_2)
np.add.at(output, output_row, array_2[input_row])

您实际上只使用array_2的前四行,因此它可以被截断为

array_2 = array2[:array_1.shape[0]]

在这种情况下,您需要将输出初始化为:

output = np.zeros_like(array_2, shape=(output_row.max() + 1, array2.shape[1]))

相关内容

  • 没有找到相关文章

最新更新