你能解释一下为什么某些特征向量(2-4(有符号差异吗?这种差异是否会影响进一步计算中的进一步计算,例如降维?
矩阵:
N = 5000;
dataA = rand(N,5);
covA = cov(dataA);
%covA = dataA*dataA'/(length(dataA)-1);
covA = covA + eps.*eye(size(covA));
[~,pA] = chol(covA);
assert(pA==0,'A is not possitive definite')
dataB = rand(N,5);
covB = cov(dataB);
%covB = dataB*dataB'/(length(dataB)-1);
covB = covB + eps.*eye(size(covB));
[~,pB] = chol(covB);
assert(pB==0,'B is not possitive definite')
[V,D] = eig(covA, covB);
V =
-0.4241 -1.0891 1.8175 2.4067 -1.3032
1.4445 -1.8960 -1.4118 -0.6514 -2.0075
0.1214 -2.5039 0.3332 -0.1705 2.3609
-2.1235 -0.7007 1.1632 -2.1532 -1.0554
-2.2599 -0.4405 -2.2236 1.2545 0.0760
蟒:
from scipy.linalg import eigh
import scipy.io
import numpy as np
cov_mat = scipy.io.loadmat('cov.mat')
covA = cov_mat['covA']
covB = cov_mat['covB']
eigvals, eigvecs = eigh(covA, covB, eigvals_only=False)
np.savetxt('eigvals.txt', eigvals, fmt='%.4f')
np.savetxt('eigvecs.txt', eigvecs, fmt='%.4f')
eigvecs =
0.4241 1.0891 -1.8175 -2.4067 -1.3032
-1.4445 1.8960 1.4118 0.6514 -2.0075
-0.1214 2.5039 -0.3332 0.1705 2.3609
2.1235 0.7007 -1.1632 2.1532 -1.0554
2.2599 0.4405 2.2236 -1.2545 0.0760
它们是相同的特征向量,因为翻转特征向量上的符号不会改变它们的公式 - 它们将具有相同的特征值。因此,它不会影响进一步的计算。
为什么它们的计算方式不同?很可能是因为运行的子例程根据正在操作的矩阵而变化,并且不在乎它们返回什么"符号",因为特征值没有特征值。
一个微不足道的数学证明:
如果x
是特征值为 q
的矩阵A
的特征向量,那么根据定义,我们有这个Ax = qx
。
因此,A(-x) = -(Ax) = -(qx) = q(-x)
,-x
是具有相同特征值的特征向量。