i有一个由132个观测值和10个变量组成的数据集。这些变量都是分类的。我试图根据差异百分比来了解我的观察结果聚类以及它们如何与众不同。即,我想找出a)是否有任何变量有助于将某些观察点与彼此分开,而b)如果是,差异的百分比是多少?
我被建议在我的数据上运行PCOA(主要坐标分析)。我使用纯素食和猿包装进行了运行。这是将CSV文件加载到R中后的代码,我称其为Data
#data.dis<-vegdist(data,method="gower",na.rm=TRUE)
#data.pcoa<-pcoa(data.dis)
然后,我被告知从PCOA数据中提取向量,因此
#data.pcoa$vectors
然后它返回了我132行,但值20列的值(例如,从轴1到轴20)
我在为什么只有10个变量时有20列的值感到困惑。我的印象是我只会得到10列。如果有任何种类的灵魂可以帮助解释a)矢量实际上代表什么,b)我如何获得轴1和2解释的差异的百分比?
我遇到的另一个问题是我不太了解从data.pcoa
提取特征值的目的,因为我在距离矩阵上运行了PCOA后看到了一些网站,但对此没有进一步的解释。
gower索引是非欧盟人的,您可以期望比欧几里得秩序(PCOA)中变量的数量更多的实际轴。但是,您说您的变量是绝对的。我认为在 r lingo中,它们是因素。如果是这样,则应使用仅接受数字数据的vegan::vegdist()
。此外,如果将变量定义为一个因素,则vegan::vegdist()
拒绝计算差异并给出错误。如果您设法使用vegdist()
,则无法正确地将变量定义为因素。如果您确实有因素变量,则应使用除素食以外的其他软件包用于Gower差异(有许多替代方案)。
te百分比对于非欧盟差异的差异有点棘手,这也给出了一些与假想维度相对应的负特征值。在这种情况下,所有正征值(实际轴)的总和高于数据的总"方差"。ape::pcoa()
返回您在元素values
中询问的信息。解释的差异比例在其元素values$Relative_eig
中。元素trace
返回总"方差"。所有这些都记录在我阅读的?pcoa
中。