我有一个相对简单的问题,如果不使用循环,我无法解决。我很难算出这道题的正确题目。假设我们有两个numpy数组:
array_1 = np.array([[0, 1, 2],
[3, 3, 3],
[3, 3, 4],
[3, 6, 2]])
array_2 = np.array([[0, 0, 0],
[1, 1, 1],
[2, 2, 2],
[3, 3, 3],
[4, 4, 4],
[5, 5, 5],
[6, 6, 6]])
array_1
表示array_2
中我们想要sum
的行的索引。因此,例如,result
数组中的第4
行应该包含array_2
中与array_1中的所有3
具有相同行索引的所有行的总和。
在代码中理解它要容易得多:
result = np.empty(array_2.shape)
for i in range(array_1.shape[0]):
for j in range(array_1.shape[1]):
index = array_1[i, j]
result[index] = result[index] + array_2[i]
结果应该是:
[[ 0 0 0]
[ 0 0 0]
[ 3 3 3]
[10 10 10]
[ 2 2 2]
[ 0 0 0]
[ 3 3 3]]
我尝试使用np.einsum
,但我需要使用数组中的两个元素作为索引,也需要使用它的行作为索引,所以我不确定np.einsum
是否是这里的最佳路径。
这就是我在图形方面遇到的问题。array_1
表示三角形的顶点的索引,array_2
表示其中行的索引对应于顶点的索引的法线
任何时候从重复索引中添加东西时,像np.add
这样的普通ufunc都不会开箱即用,因为它们只处理一次重复的花式索引。相反,您必须使用无缓冲的版本,即np.add.at
。
这里,您有一对索引:array_1
中的行是array_2
中的行索引,array_1
中的元素是输出的行索引。
首先,将索引明确地构造为花式索引。这将使它们的使用更加简单:
output_row = array_1.ravel()
input_row = np.repeat(np.arange(array_1.shape[0]), array_1.shape[1]).ravel()
您可以将input_row
直接应用于array_2
,但需要add.at
才能使用output_row
:
output = np.zeros_like(array_2)
np.add.at(output, output_row, array_2[input_row])
您实际上只使用array_2
的前四行,因此它可以被截断为
array_2 = array2[:array_1.shape[0]]
在这种情况下,您需要将输出初始化为:
output = np.zeros_like(array_2, shape=(output_row.max() + 1, array2.shape[1]))