我有以下数据,
Data <- c(8, 15, 8, 10, 7, 5, 2, 11, 8, 7, 6, 6, 4, 6, 10,
3, 9, 7, 15, 6, 5, 9, 8, 3, 3, 8, 5, 14, 8, 11,
8, 10, 7, 4, 6, 4, 6, 7, 11, 7, 8, 7, 8, 6, 5,
12, 7, 8, 13, 10, 6, 9, 7)
我想使用dgof
软件包在R中进行KS测试,但不知道如何使用它。我还符合上述数据的二项式和泊松分布。
现在,我想使用KS测试来识别哪种模型(二项式或泊松)代表数据。
谢谢。
首先您有两个问题。
- Kolmogorov的测试不适用于连续分布。kolmogorov-smirnov拟合优度测试
- 它与数据有联系。
即使我想应用测试,它将以以下方式进行,消除重复值并使用泊松和二项式分布的最大似然估计器。
x <- unique(Data)
ks.test(x,"ppois",lambda <- mean(x))
One-sample Kolmogorov-Smirnov test
data: x
D = 0.2058, p-value = 0.5273
alternative hypothesis: two-sided
ks.test(x,"pbinom",n <- length(x),p <- mean(x)/n)
One-sample Kolmogorov-Smirnov test
data: x
D = 0.3126, p-value = 0.103
alternative hypothesis: two-sided
我们可以得出结论,泊松模型最能代表数据,而不依赖于p值。