sql-STDEVP或STDEV以及如何使用它

我有一个表：

LocationId OriginalValue Mean
1          0.45         3.99  
2          0.33         3.99
3          16.74        3.99
4          3.31         3.99

等等。。。

我该如何使用此表计算Standard Deviation，以及您推荐的STDEVP或STDEV？

要使用它，只需：

SELECT STDEVP(OriginalValue)
FROM yourTable

从下面来看，您可能想要STDEVP。

从这里：

STDEV用于评估的数字组仅为整个群体的部分抽样。除以方差平方和的分母是N-1，其中N是观测次数（数据集中项目的计数）。从技术上讲，减去1被称为"1"；无偏见"
STDEVP在被评估的一组数字是完整的时使用-它是值的整个总体。在这种情况下，不减去1，用于除以偏差平方和的分母只是N本身，即观测值的数量（数据集中项目的计数）。从技术上讲，这被称为"；有偏见"记住STDEVP中的P代表"；人口；可能会有所帮助。由于数据集不仅仅是一个样本，而是由所有实际值组成的，因此该标准偏差函数可以返回更精确的结果。

通常，当您必须根据样本估计标准偏差时，应该使用STDEV。但是，如果将整列数据作为参数给定，则使用STDEVP。

通常，如果您的数据代表整个人口，请使用STDEVP；否则，使用STDEV。

请注意，对于大样本，函数返回的值几乎相同，因此在这种情况下最好使用STDEV。

在统计学中，有两种类型的标准偏差：一种用于样本，另一种用于总体。

样本标准差通常用字母s表示，用作总体标准差的估计值。

总体标准差，通常用希腊字母小写西格玛表示，当数据构成完整总体时使用。

很难直接回答你的问题——样本或群体——因为很难说出你在处理什么：样本或群体。这通常取决于上下文。

请考虑以下示例。如果我想知道班上学生年龄的标准差，那么我u=会使用STDEVP，因为这个班就是我的人口。但是，如果我想把我的班级作为学校所有学生的样本（这就是所谓的方便样本，可能有偏见，但我跑题了），那么我会使用STDEV，因为我的班级是一个样本。由此得到的值将是我对STDEVP的最佳估计。

如上所述，（1）对于大样本量（比如超过30个），两者之间的差异变得微不足道，（2）通常你应该使用STDEV，而不是STDEVP，因为在实践中，我们通常无法接触到人群。事实上，有人可能会说，如果我们总是能够接触到人口，那么我们就不需要统计数据了。推断统计学的全部目的是能够根据样本对总体进行推断。

相关内容

最新更新

热门标签：