Hmisc中的CurveRep,用于基于3个时间点对纵向曲线进行聚类



我正在进行以下项目,并正在探索Hmisc提供的CurveRep()集群方法。(CurveRep根据基于CLARA聚类算法的相似模式对个体受试者的纵向生长曲线进行聚类)。由于我还没有发现任何使用CurveRep()的出版物,而且互联网上对它的讨论也很少,如果你能告诉我你使用它的经历或你对它的看法,我将不胜感激!-我的项目:我在三个时间点(0.30120分钟)在n=500名受试者中测量了大约200种代谢物。个人的时间进程变化很大,但在意大利面条图中,似乎有一些组(例如直线和平面曲线、峰形曲线、谷形曲线)。我想将这些曲线聚类为两到三个具有代表性的时间过程,然后为每个聚类拟合一个特定于曲线的回归模型。CurveRep()似乎正是我想要的,它产生了可接受的集群解决方案(尽管解决方案更多地基于不同的y轴交叉点,而不是不同的增长模式)。

它有什么好处吗?是否存在根据类似纵向变化进行分组的替代聚类算法(例如,聚类1="线性上升",聚类2="山谷形")?非常感谢!Chris

三个时间点太少,所有的时间序列方法都无法为您工作。看看DTW——它是为更高的分辨率而设计的。

聚类算法,如k-means、PAM和CLARA可以为您工作。看看集群中心。

可能有必要更仔细地预处理您的数据。

如果您对变化而不是绝对值感兴趣,请相应地对数据进行编码。例如,

x1、x2、x3->x2-x1、x3-x2

x1,x2,x3 -> x1-mu,x2-mu,x3-mu with mu=(x1+x2+x3)/3

这将使聚类结果更有可能与您的动机相匹配。

最新更新