R 中的聚类分析:如何从 pvclust 中获得确定性结果



pvclust非常适合 R 中的聚类分析。但是,当它作为批处理操作的一部分运行时,为相同的数据获得不同的结果很烦人。显然,同一数据有许多"正确"的聚类,似乎pvclust使用一些随机性来确定特定运行的聚类。但是有没有办法获得确定性的结果呢?

我希望能够提供一个最小的、可重复的分析包:数据加上一个 R 脚本,以及一个包含我对聚类分析的解释的单独书面文档。然后,其他人可以添加到分析中,例如通过改变情节的美学外观。现在,解释将始终与其他人运行包含pvclust的脚本时获得的内容不同步。

不仅用于聚类分析,而且当涉及随机性时,您可以修复随机数生成器,以便始终获得相同的结果。

尝试:

set.seed(seed=123)
# your code here

seed可以是任何整数,也可以是可以转换为整数的内容。仅此而已。

我只使用了k的意思。在那里,我必须将"运行"或迭代次数设置为比默认值更高的值,以便在连续运行中获得相同的库斯特。

最新更新