解释phm R包-持久同源-数据的拓扑分析-聚类分析



我正在学习用R.的pHom包分析数据的拓扑。

我想理解(描述)一组数据(矩阵(3500行,10列))。为了达到这样的目的,R-package phm运行描述数据的持久同源性测试。

(参考:下面的视频描述了我们在拓扑中的同源性-参考视频4分钟:http://www.youtube.com/embed/XfWibrh6stw?rel=0&autoplay=1)。

使用r包" phm "(链接:http://cran.r-project.org/web/packages/phom/phom.pdf)可以运行以下示例。

我需要帮助,以便正确理解phom函数是如何工作的,以及如何解释数据(图)。

在r中使用phm包参考手册中的示例# 1,在r上运行它

加载包
library(phom)
library(Rccp)
示例1

x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
intervals <- pHom(points, max_dim, max_f, metric="manhattan")
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")

如果有人能帮助我,我将不胜感激:

问题:a)值max_f是什么意思,它来自哪里?根据我的数据?我设置它们?b) plot: plotPersistenceDiagram(如果你在R中运行这个例子,你会看到这个plot),我如何解释它?

谢谢。

注意:为了运行"phm"包,你需要"Rccp"包,你需要最新版本的r3.03。

前面的例子是在R中分别加载了"phom"one_answers"Rccp"包后完成的。

这是一个完全错误的地方,但以防万一一年后你还在努力解决这个问题,我碰巧知道答案。

计算持久同源性有两个步骤:

  1. 将点云变成简单复合体的过滤
  2. 计算简单复合体的同源性

步骤1的"过滤"部分意味着您必须为整个参数范围计算简单复合体。这种情况下的参数是epsilon,即点之间连接的距离阈值。max_f变量限定了epsilon扫描从0到max_f的范围。

plotPersistenceDiagram将同源的"持久性条形码"显示为点而不是线。该点的x坐标是该拓扑特征的诞生时间(它第一次出现的epsilon的值),y坐标是死亡时间(它消失的epsilon的值)。

最新更新