我想比较两个具有不同手段的人群。我想找到一种比较他们的差异的方法,以了解两个人群中的哪个值与平均值进一步分散。
问题是,我认为我应该在每个分布的平均值上标准化/归一化。
建议?
下一步将是在R中获得一个功能。
您不需要标准化/归一化,因为将方差计算为距平均值的距离,因此已经围绕样本平均值进行标准化。
演示此运行以下代码
x<-runif(10000,min=100,max=101)
y<-runif(10000,min=1,max=2)
mean(x)
mean(y)
var(x)
var(y)
您会看到虽然平均值不同,但两个样本的方差是相同的(由于伪随机数的生成和样本大小而导致一定的差异)