sql-STDEVP或STDEV以及如何使用它



我有一个表:

LocationId OriginalValue Mean
1          0.45         3.99  
2          0.33         3.99
3          16.74        3.99
4          3.31         3.99

等等。。。

我该如何使用此表计算Standard Deviation,以及您推荐的STDEVPSTDEV

要使用它,只需:

SELECT STDEVP(OriginalValue)
FROM yourTable

从下面来看,您可能想要STDEVP

从这里:

STDEV用于评估的数字组仅为整个群体的部分抽样。除以方差平方和的分母是N-1,其中N是观测次数(数据集中项目的计数)。从技术上讲,减去1被称为"1";无偏见"

STDEVP在被评估的一组数字是完整的时使用-它是值的整个总体。在这种情况下,不减去1,用于除以偏差平方和的分母只是N本身,即观测值的数量(数据集中项目的计数)。从技术上讲,这被称为";有偏见"记住STDEVP中的P代表";人口;可能会有所帮助。由于数据集不仅仅是一个样本,而是由所有实际值组成的,因此该标准偏差函数可以返回更精确的结果。

通常,当您必须根据样本估计标准偏差时,应该使用STDEV。但是,如果将整列数据作为参数给定,则使用STDEVP

通常,如果您的数据代表整个人口,请使用STDEVP;否则,使用STDEV

请注意,对于大样本,函数返回的值几乎相同,因此在这种情况下最好使用STDEV

在统计学中,有两种类型的标准偏差:一种用于样本,另一种用于总体。

样本标准差通常用字母s表示,用作总体标准差的估计值。

总体标准差,通常用希腊字母小写西格玛表示,当数据构成完整总体时使用。

很难直接回答你的问题——样本或群体——因为很难说出你在处理什么:样本或群体。这通常取决于上下文。

请考虑以下示例。如果我想知道班上学生年龄的标准差,那么我u=会使用STDEVP,因为这个班就是我的人口。但是,如果我想把我的班级作为学校所有学生的样本(这就是所谓的方便样本,可能有偏见,但我跑题了),那么我会使用STDEV,因为我的班级是一个样本。由此得到的值将是我对STDEVP的最佳估计。

如上所述,(1)对于大样本量(比如超过30个),两者之间的差异变得微不足道,(2)通常你应该使用STDEV,而不是STDEVP,因为在实践中,我们通常无法接触到人群。事实上,有人可能会说,如果我们总是能够接触到人口,那么我们就不需要统计数据了。推断统计学的全部目的是能够根据样本对总体进行推断。

相关内容

  • 没有找到相关文章

最新更新