我有两组不同的随机分布的实验数据。我必须检查天气是否来自同一数据集。我希望在 python 中使用 scipy 应用 2 个示例 KS 测试。
我不明白如何在函数ks_2samp
中传递两个数据序列。
scipy.stats.ks_2samp(data1, data2)
谁能解释什么是数据1和数据2?我可以使用序列直接传递数据吗?
像这样使用它:
import numpy as np
from scipy import stats
dataset1 = np.random.randn(100) #random distribution
dataset2 = np.random.randn(100)
res = stats.ks_2samp(dataset1, dataset2)
print res
您的结果如下所示:
(0.089999999999999969, 0.79418377128477335)