我得到了一个20122的dim矩阵,每列都是一个20元素的向量。现在我将umap应用于矩阵,得到一个2122矩阵和一个umap图。如何衡量这种umap模型的拟合优度?有什么标准的方法可以做到这一点吗?
UMAP有多种用途,如聚类、监督学习和异常值检测。
你到底想用UMAP做什么?
在聚类的情况下,您可以查看sklearn聚类评估,并将分数与t-SNE等其他算法进行比较。
要查找结构,可以将数据缩减为2-3维,并使用散点图对结果进行目测。
当你标记了数据后,你可以尝试用(非线性(分类器(如随机森林(对它们进行分类,并将结果得分(如准确性(与PCA等其他降维技术进行比较。
也许你从sklearn那里寻找可信度。您可以将PCA的分数与UMAP或任何其他降维算法的分数进行比较。源