我正在尝试对维度为(1000001024)的矩阵执行白化处理。我需要确定sklearn.decomposition的PCA或RandomizedPCA是否可以处理这种大小的问题,如果不能,我可以使用的最大数量的功能是什么,并且仍然可以在大约24小时内完成。实现没有并行化。
根据sklearn.decomposition.PCA的文档,假设n~n_samples~n_features,PCA变换的时间复杂度为"O(n**3)"但我不确定~符号是什么意思。
随机化主成分分析应该更有效,因为它是一种近似,但我不知道有多少。文档中没有任何关于它的时间复杂性的内容。
作为参考,我执行了一个到(100000,2)的转换,大约需要2分钟。我已经开始将(PCA和RandomizedPCA)转换为(100000,1024),这两个转换都运行了大约一个小时。我想知道它们是否能完成,但如果不能,如果它们还在运行,我会在24小时后终止它们。
通过实验,随机PCA似乎线性增长,并在一个多小时内完成1024个特征。