我正在尝试计算一个值在一列中出现的次数,按ID分组。下面是一个示例数据集:
ID Yes_or_No
1 Yes
1 No
2 Yes
3 Yes
4 Yes
4 No
5 Yes
一般的想法是,如果我对某个 ID 的不同值进行计数,如果计数大于 1,那么我可以创建一个新列,当某个 ID 同时具有"是"和"否"值时,我可以创建一个新列,该列调用它"可能"。这是我最初写的,但不起作用:
SELECT ID,
CASE WHEN COUNT(DISTINCT Yes_or_No)>1 AS 'Maybe'
ELSE Yes_or_No
END AS YesNoMaybe
FROM db
GROUP BY 1;
这是更大的整体查询的一部分,因此,理想情况下,我希望能够在 Case 语句中使用 Count 而不是 FROM 语句中的子查询以节省内存。欢迎其他解决方法。
您需要将
AS
更改为THEN
:
SELECT ID,
CASE WHEN COUNT(DISTINCT Yes_or_No)>1 THEN 'Maybe'
ELSE MIN(Yes_or_No) --here agg function is required
END AS YesNoMaybe
FROM db
GROUP BY ID; --GROUP BY 1 is antipattern (explicit name >> position)
DBFiddle 演示
您的case
表达式应为
SELECT ID,
(CASE WHEN COUNT(DISTINCT Yes_or_No) > 1
THEN 'Maybe' ELSE MIN(Yes_or_No)
END) AS YesNoMaybe
FROM db
GROUP BY ID;
As
不是case
表达式的一部分,它是用于定义列 alise 或表 alise 的语句select
的一部分