我在少数数据集上使用了两种算法(方法(,并获得了一些结果。现在我想检查一下所获得的结果是否具有可比性?我使用了两个样本K-S测试,得到了以下结果,现在如何解释测试结果?结论应该是什么?
KstestResult(statistic=0.11320754716981132, pvalue=0.8906908896753045)
D_alpha= 0.2641897545611759
K-S检验用于比较分布。所以,当你应用它时,你有兴趣比较分布,比如F(X(和另一个分布$G(X($。通常,前者是您的数据分布,后者是另一个数据分布或您指定的东西(例如高斯(。
现在,检验的零假设是F(X(=G(X(。该测试产生statistic
,以评估该零假设是否可以被假设为真。你通常不会直接看这个数量;相反,您希望查看p-value
。如果零假设成立,这是观察到比你观察到的统计数据更大的统计数据的概率。在这种情况下,p值的低值表明,如果假设成立,观察到比你观察到的统计数据更大的统计数据的可能性非常小(即低概率(;因此,由于你观察到了一个统计数据,它给了你一个小的p值,你倾向于相信你的零假设一定是假的,而且实际上F(X(与G(X(不同。
在您的情况下,p值很高(对于低p值,我们希望0.1、0.05或0.01或更低(,因此您不会拒绝零假设。因此,你会说你测试的东西是一样的,在统计上没有差异。
然而,我强烈鼓励您阅读更多关于该测试的信息,了解它的使用方式以及何时;也要试着了解它是否适合你的情况。你可以在维基百科和scipy文档上做这件事