r语言 - 对于初学者来说,公制和非公制 MDS 有什么区别?



我对数据科学相当陌生,想用简单的话(比如教你的祖母(知道度量和非度量多维缩放之间的区别是什么。

我已经在谷歌上搜索了 2 天并观看了不同的视频,并且无法完全理解人们用来描述差异的一些术语,也许我缺乏一些基础知识,但我不知道在哪个领域,所以如果你有一个想法,在处理这个主题之前我应该有一个坚定的理解, 我将不胜感激你的建议。以下是我所知道的:

多维缩放是一种减少维度的方法,以便能够以更友好的方式可视化或表示数据。我知道MDS有几种方法,如公制和非公制,PCA和FA(也许FA是PCA的一部分,我不确定(。

我尝试应用它的示例是一组数据,显示与这些城市相关的不同城市和属性。例如,在 1-7(1 最低 - 7 最高(的分数上,这是每个城市的分数和相应的属性。

**Clean**      **Friendly**     **Expensive**     **Beautiful**          

柏林----------- 4 --------------------- 2-----------------------5------------------------6

日内瓦---------6 --------------------- 3-----------------------7------------------------7

巴黎------------ 3 --------------------- 4-----------------------6------------------------7

巴塞罗那----- 2 --------------------- 6-----------------------3------------------------4

我如何知道我应该使用公制还是非公制 MDS。是否有一般的经验法则或简单的逻辑,我可以用来决定,而无需深入研究技术过程。

谢谢

好吧,我可能无法给你一个具体的答案,但一个简单的答案是,度量 MDS 已经具有距离形式的输入矩阵(即城市之间的实际距离(,因此距离在输入矩阵中具有意义,并从这些距离创建实际物理位置的地图。

在非公制 MDS 中,距离只是排名的表示(即高如 7 或低如 1(,它们本身没有任何意义,但它们是使用欧几里得几何创建地图所必需的,然后地图仅显示由地图上坐标之间的距离表示的排名的相似性。

度量MDS处理一个item x item输入矩阵,其条目表示欧几里得距离(度量MDS的特殊情况称为经典MDS,等效于PCA(或项目之间的任何其他距离

非公制 MDS处理项目之间的一些类似距离的度量(我们称之为差异(。不要求差异性满足距离/度量的形式属性(有关所需的属性,请参阅此 wiki(。唯一的要求是应该可以按非递减顺序对所有item x item对的相异性值进行排序。

在您的情况下,item x attribute矩阵包含有序数据(比例为 1-7 的数据(。欧几里得距离在这里不合适,但例如皮尔逊"距离"或余弦"距离">通常用于此类数据,并且由于它们不是适当的距离,因此应选择非公制 MDS。

相关内容

  • 没有找到相关文章

最新更新