我想计算矩阵的奇异值分解,奇异值的顺序很重要。默认情况下,似乎numpy.linalg.svd
(并且scipy.linalg.svd
(对奇异值进行排序,这使我无法分辨哪一列对应于每个奇异值。
例:
import numpy as np
X = np.array([[-74, 80, 18, -56, -112],
[14, -69, 21, 52, 104],
[66, -72, -5, 764, 1528],
[-12, 66, -30, 4096, 8192],
[3, 8, -7, -13276, -26552],
[4, -12, 4, 8421, 16842]])
U, D, V = np.linalg.svd(X)
print(D)
返回:
array([3.63684045e+04, 1.70701331e+02, 6.05331879e+01, 7.60190176e+00,
1.17158094e-12])
当我需要时:
array([1.70701331e+02, 6.05331879e+01, 7.60190176e+00, 3.63684045e+04,
1.17158094e-12])
有没有办法获取奇异值 (D( 使它们未排序?还必须保留 X = UDV^T 的关系。
编辑:这里需要一些背景来阐明我的误解。我试图在本文中重现第 2.3 节,方差分解方法。
当你说:
默认情况下,numpy.linalg.svd(和scipy.linalg.svd(对奇异值进行排序,这使得我无法分辨哪一列对应于每个奇异值。
我认为你犯了一个错误,在"奇异值分解"中,奇异值没有唯一的顺序,重要的是U、D和V的列向量的顺序是这样的: U * D * V == X
这就是为什么按照惯例,它们是按降序排列的,但显然,酉基 U 和共轭转置 V 的垂直向量也是按照上述公式成立的顺序设置的。
如果你想要一个证明,要从U,D和V计算X,你必须做到:
from scipy import linalg
#decompose
U, D, V = np.linalg.svd(X)
# get dim of X
M,N = X.shape
# Construct sigma matrix in SVD (it simply adds null row vectors to match the dim of X
Sig = linalg.diagsvd(D,M,N)
# Now you can get X back:
assert np.sum(np.dot(U, np.dot(Sig, V)) - X) < 0.00001