我正在对一个冗余的全矩阵(即可以是一个不丢失信息的三角形矩阵)进行一些计算。我意识到我只能计算三角形的较低部分以获得更快的结果。完成后,如何将下部三角形投影到上部?
换言之,如何反转np.tril
方法?
print DF_var.as_matrix()
# [[1 1 0 1 1 1 0 1 0 0 0]
# [1 1 1 1 1 0 1 0 1 1 1]
# [0 1 1 0 0 0 0 0 0 0 0]
# [1 1 0 1 0 0 0 0 0 0 0]
# [1 1 0 0 1 0 0 0 0 0 0]
# [1 0 0 0 0 1 1 0 0 0 0]
# [0 1 0 0 0 1 1 0 0 0 0]
# [1 0 0 0 0 0 0 1 1 0 0]
# [0 1 0 0 0 0 0 1 1 0 0]
# [0 1 0 0 0 0 0 0 0 1 0]
# [0 1 0 0 0 0 0 0 0 0 1]]
print np.tril(DF_var.as_matrix())
# [[1 0 0 0 0 0 0 0 0 0 0]
# [1 1 0 0 0 0 0 0 0 0 0]
# [0 1 1 0 0 0 0 0 0 0 0]
# [1 1 0 1 0 0 0 0 0 0 0]
# [1 1 0 0 1 0 0 0 0 0 0]
# [1 0 0 0 0 1 0 0 0 0 0]
# [0 1 0 0 0 1 1 0 0 0 0]
# [1 0 0 0 0 0 0 1 0 0 0]
# [0 1 0 0 0 0 0 1 1 0 0]
# [0 1 0 0 0 0 0 0 0 1 0]
# [0 1 0 0 0 0 0 0 0 0 1]]
如何将其转换回完整的矩阵?
假设A
作为输入数组,下面列出了一些方法。
方法#1:在A
-的转置版本上使用np.triu
np.triu(A.T,1) + A
方法2:避免使用A.T和A之间直接求和的np.triu
,然后索引以设置对角线元素-
out = A.T + A
idx = np.arange(A.shape[0])
out[idx,idx] = A[idx,idx]
方法#3:与前一种方法相同,但使用内置索引进行压缩-
out = A.T + A
np.fill_diagonal(out,np.diag(A))
第4种方法:与前一种方法相同,但使用布尔索引设置对角线元素-
out = A.T + A
mask = np.eye(out.shape[0],dtype=bool)
out[mask] = A[mask]
方法#5:使用基于掩码的np.where
-对角元素选择
np.where(np.eye(A.shape[0],dtype=bool),A,A.T+A)
方法#6:使用基于掩模的np.where
-选择所有元素
np.where(np.triu(np.ones(A.shape[0],dtype=bool),1),A.T,A)
运行时测试
功能-
def func1(A):
return np.triu(A.T,1) + A
def func2(A):
out = A.T + A
idx = np.arange(A.shape[0])
out[idx,idx] = A[idx,idx]
return out
def func3(A):
out = A.T + A
np.fill_diagonal(out,np.diag(A))
return out
def func4(A):
out = A.T + A
mask = np.eye(out.shape[0],dtype=bool)
out[mask] = A[mask]
return out
def func5(A):
return np.where(np.eye(A.shape[0],dtype=bool),A,A.T+A)
def func6(A):
return np.where(np.triu(np.ones(A.shape[0],dtype=bool),1),A.T,A)
计时-
In [140]: # Input array
...: N = 5000
...: A = np.tril(np.random.randint(0,9,(N,N)))
...:
In [141]: %timeit func1(A)
...: %timeit func2(A)
...: %timeit func3(A)
...: %timeit func4(A)
...: %timeit func5(A)
...: %timeit func6(A)
...:
1 loops, best of 3: 617 ms per loop
1 loops, best of 3: 354 ms per loop
1 loops, best of 3: 354 ms per loop
1 loops, best of 3: 395 ms per loop
1 loops, best of 3: 597 ms per loop
1 loops, best of 3: 440 ms per loop
看起来方法#2&3个非常高效!
由于矩阵是对称的,您可以执行:
m = np.array([1,1,0,1,1,1,0,1,1]).reshape((3,3))
# after some computation you get x
x = np.tril(m)
m_recomposed = x + x.transpose() - np.diag(np.diag(x))
#array([[1, 1, 0],
# [1, 1, 1],
# [0, 1, 1]])
#In [152]: np.array_equal(m, m_recomposed)
#Out[152]: True