计算行组之间的中位数 (SQL)



我有一个包含考试结果的关系数据库,但我只需要的查询只使用一个表:

  • Results_tbl = student_no INT,
  • subject_code 瓦尔查尔(5(,
  • 得分浮点数,
  • 日期
  • 日期

我需要查询来计算每个科目参加考试的学生中位数(考虑到每个科目的学生超过 1 次考试(,然后显示哪个科目的中位数最高。

我在SQL(元数据库(上计算中位数的知识非常有限,我开始使用result_table.student_no count(*(函数和GROUP BY results_tbl.subject_code,但我认为这不是合适的方法

对于我需要的表中的每个主题代码

例如。

# OF STUDENT WHO SAT EXAM = _ _ _ & MEDIAN # OF STUDENTS = _ _

(按说明订购(

鉴于您之前的问题被标记为 SQL Server,我将假设这就是您正在使用的。在这种情况下,您可以使用PERCENTILE_CONT()PERCENTILE_DISC()

例如

SELECT  t.Col,
        Median_Cont = PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY t.Col) OVER(),
        Median_Disc = PERCENTILE_DISC(0.5) WITHIN GROUP(ORDER BY t.Col) OVER()
FROM    (VALUES (1), (2), (3), (4)) AS t (Col);

给:

Col     Median_Cont     Median_Disc
--------------------------------------
1       2.5             2
2       2.5             2
3       2.5             2
4       2.5             2

或者,要约束结果,您需要一个子查询:

SELECT  t.Col
FROM    (   SELECT  t.Col,
                    Median_Disc = PERCENTILE_DISC(0.5) 
                                    WITHIN GROUP(ORDER BY t.Col) OVER()
            FROM    (VALUES (1), (2), (3), (4)) AS t (Col)
        ) AS t
WHERE   t.Col = t.Median_Disc;

结果

Col
-----
2

对于您的具体示例,我认为您还需要包含一个PARTITION BY,以确保每个主题的中位数是校准的:

SELECT  r.subject_code, r.score, r.Date
FROM    (   SELECT  r.*,
                    Median = PERCENTILE_DISC(0.5) 
                                    WITHIN GROUP(ORDER BY r.Score) 
                                    OVER(PARTITION BY r.Subject_Code)
            FROM    Results_tbl AS r
        ) AS r
WHERE   r.Score = r.Median;

最新更新