我有一个表:
LocationId OriginalValue Mean
1 0.45 3.99
2 0.33 3.99
3 16.74 3.99
4 3.31 3.99
等等。。。
我该如何使用此表计算Standard Deviation
,以及您推荐的STDEVP
或STDEV
?
要使用它,只需:
SELECT STDEVP(OriginalValue)
FROM yourTable
从下面来看,您可能想要STDEVP
。
从这里:
STDEV用于评估的数字组仅为整个群体的部分抽样。除以方差平方和的分母是N-1,其中N是观测次数(数据集中项目的计数)。从技术上讲,减去1被称为"1";无偏见"
STDEVP在被评估的一组数字是完整的时使用-它是值的整个总体。在这种情况下,不减去1,用于除以偏差平方和的分母只是N本身,即观测值的数量(数据集中项目的计数)。从技术上讲,这被称为";有偏见"记住STDEVP中的P代表";人口;可能会有所帮助。由于数据集不仅仅是一个样本,而是由所有实际值组成的,因此该标准偏差函数可以返回更精确的结果。
通常,当您必须根据样本估计标准偏差时,应该使用STDEV
。但是,如果将整列数据作为参数给定,则使用STDEVP
。
通常,如果您的数据代表整个人口,请使用
STDEVP
;否则,使用STDEV
。
请注意,对于大样本,函数返回的值几乎相同,因此在这种情况下最好使用STDEV
。
在统计学中,有两种类型的标准偏差:一种用于样本,另一种用于总体。
样本标准差通常用字母s表示,用作总体标准差的估计值。
总体标准差,通常用希腊字母小写西格玛表示,当数据构成完整总体时使用。
很难直接回答你的问题——样本或群体——因为很难说出你在处理什么:样本或群体。这通常取决于上下文。
请考虑以下示例。如果我想知道班上学生年龄的标准差,那么我u=会使用STDEVP,因为这个班就是我的人口。但是,如果我想把我的班级作为学校所有学生的样本(这就是所谓的方便样本,可能有偏见,但我跑题了),那么我会使用STDEV,因为我的班级是一个样本。由此得到的值将是我对STDEVP的最佳估计。
如上所述,(1)对于大样本量(比如超过30个),两者之间的差异变得微不足道,(2)通常你应该使用STDEV,而不是STDEVP,因为在实践中,我们通常无法接触到人群。事实上,有人可能会说,如果我们总是能够接触到人口,那么我们就不需要统计数据了。推断统计学的全部目的是能够根据样本对总体进行推断。