无监督学习降低了维度/聚类



我试图了解如何使用无监督学习将数据拆分为集群。例如,k 均值方法。

我有 20 列数据,如何在不丢失 18 列必要信息的情况下将其投影到 2D 表面上?

我应该用什么来做这件事?

任何帮助将不胜感激。

如果您只是对二维数据感兴趣,请考虑使用 t-SNE。scikit-learnpython 包有一个很棒的实现,你可以使用。但是,请记住,您不应该将数据聚类在t-SNE输出上,因为数据所在的空间在此过程中会变得足够失真(仅保持短距离,而较长的距离会大量更改为更短或更长(

最新更新