在 Case 语句中使用 Count 条件对变量进行分类



我正在尝试计算一个值在一列中出现的次数,按ID分组。下面是一个示例数据集:

ID      Yes_or_No
1       Yes
1       No
2       Yes
3       Yes
4       Yes
4       No
5       Yes

一般的想法是,如果我对某个 ID 的不同值进行计数,如果计数大于 1,那么我可以创建一个新列,当某个 ID 同时具有"是"和"否"值时,我可以创建一个新列,该列调用它"可能"。这是我最初写的,但不起作用:

SELECT  ID,
        CASE WHEN COUNT(DISTINCT Yes_or_No)>1 AS 'Maybe'
        ELSE Yes_or_No
        END AS YesNoMaybe
FROM db
GROUP BY 1;

这是更大的整体查询的一部分,因此,理想情况下,我希望能够在 Case 语句中使用 Count 而不是 FROM 语句中的子查询以节省内存。欢迎其他解决方法。

您需要将AS更改为THEN

SELECT  ID,
        CASE WHEN COUNT(DISTINCT Yes_or_No)>1 THEN 'Maybe'
        ELSE MIN(Yes_or_No)    --here agg function is required
        END AS YesNoMaybe
FROM db
GROUP BY ID;   --GROUP BY 1 is antipattern (explicit name >> position)

DBFiddle 演示

您的case表达式应为

SELECT  ID,
        (CASE WHEN COUNT(DISTINCT Yes_or_No) > 1 
              THEN 'Maybe' ELSE MIN(Yes_or_No)
         END) AS YesNoMaybe
FROM db
GROUP BY ID;

As不是case表达式的一部分,它是用于定义 alise 或 alise 的语句select的一部分

最新更新