在scikit-learn中使用PCA生成索引时出现值错误



使用以下函数,我尝试从数据生成索引:

功能:

import numpy as np
from sklearn.decomposition import PCA   
def pca_index(data,components=1,indx=1):
    corrs = np.asarray(data.cov())
    pca   = PCA(n_components = components).fit(corrs)
    trns = pca.transform(data)
    index=np.dot(trns[0:indx],pca.explained_variance_ratio_[0:indx])
    return index

指数:从主成分生成

index = pca_index(data=mydata,components=3,indx=2)

调用函数时生成以下错误:

Traceback (most recent call last):
File "<ipython-input-411-35115ef28e61>", line 1, in <module>
index = pca_index(data=mydata,components=3,indx=2)
File "<ipython-input-410-49c0174a047a>", line 15, in pca_index
index=np.dot(trns[0:indx],pca.explained_variance_ratio_[0:indx])
ValueError: shapes (2,3) and (2,) not aligned: 3 (dim 1) != 2 (dim 0)

任何人都可以帮助解决错误。

根据我的理解,当我将下标索引作为变量 (indx) 传递时,以下位置会出现一些错误:

trns[0:indx],pca.explained_variance_ratio_[0:**indx**]

np.dot中,您尝试将具有维度 (2,3) 的矩阵与具有维度 (2,) 的矩阵相乘,即向量。

但是,您只能将 NxM 乘以 MxP,例如

(3,2) 乘以 (2,1) 或 (2,3) 乘以 (3,1)。

在您的示例中,第二个矩阵的维度为 (2,),用 numpy 术语来说,它与 (2,1) 相似但不相同。您可以使用vector.reshape([2,1])将矢量重塑为矩阵

您也可以转置第一个矩阵,从而将其尺寸从 (2,3) 转换为 (3,2)。

但是,请确保将适当的矩阵相乘,因为结果将与您预期的不同。

相关内容

  • 没有找到相关文章