我有兴趣在执行多维缩放后看看特征值。什么函数能做到这一点?我看了文档,但它根本没有提到特征值。
下面是一个代码示例:mds = manifold.MDS(n_components=100, max_iter=3000, eps=1e-9, random_state=seed, dissimilarity="precomputed", n_jobs=1) results = mds.fit(wordDissimilarityMatrix) # need a way to get the Eigenvalues
我也无法从阅读文档中找到它。我怀疑他们不是在执行经典的MDS,而是更复杂的东西:
"现代多维标度-理论与应用"Borg, I.;Groenen p . Springer Series in Statistics (1997)
<非度量多维标度:数值方法 xmlns:非度量多维标度="#unknown"> Kruskal, J. Psychometrika, 29 (1964)非度量多维标度:数值方法>
"优化非度量假设的拟合优度的多维尺度"Kruskal, J. Psychometrika, 29, (1964)
如果你在寻找每个经典MDS的特征值,那么你自己得到它们并不难。步骤如下:
- 获取距离矩阵。然后平方。
- 执行double-centering。
- 查找特征值和特征向量
- 选择前k个特征值。
- 你的第一个主成分是sqrt(eigenvalue_i)*eigenvector_i
参见下面的代码示例:
import numpy.linalg as la
import pandas as pd
# get some distance matrix
df = pd.read_csv("http://rosetta.reltech.org/TC/v15/Mapping/data/dist-Aus.csv")
A = df.values.T[1:].astype(float)
# square it
A = A**2
# centering matrix
n = A.shape[0]
J_c = 1./n*(np.eye(n) - 1 + (n-1)*np.eye(n))
# perform double centering
B = -0.5*(J_c.dot(A)).dot(J_c)
# find eigenvalues and eigenvectors
eigen_val = la.eig(B)[0]
eigen_vec = la.eig(B)[1].T
# select top 2 dimensions (for example)
PC1 = np.sqrt(eigen_val[0])*eigen_vec[0]
PC2 = np.sqrt(eigen_val[1])*eigen_vec[1]