我需要在表中添加带有唯一整数/哈希的列,以用作行ID。
我使用此查询创建了一个表重复:
CREATE TABLE duplicates AS
SELECT
"a", "b", COUNT(*) as _count
FROM
"table"
GROUP BY
"a", "b"
HAVING
_count > 1
ORDER BY
_count desc
现在,我需要添加一个包含每一行唯一ID的列。我尝试了 我现在有点缺乏想法,因为关于雪花SQL的讨论尚未广泛,雪花的帮助页没有帮助我。ALTER TABLE DUPLICATES ADD 'id' int identity(1,1)
,但是返回: sql汇编错误:不能将列列列为非恒定默认值'
一种简单的方法是使用 row_number()
:
CREATE TABLE duplicates AS
SELECT ROW_NUMBER() OVER (ORDER BY COUNT(*) DESC) as id,
"a", "b", COUNT(*) as _count
FROM "table"
GROUP BY "a", "b"
HAVING _count > 1
ORDER BY _count desc;
在雪花中执行此操作的最简单方法是使用序列。非常简单,但它们可用于生成一个主键或任何需要唯一值的列的值。如何使用:
https://docs.snowflake.net/manuals/user-guide/querying-sequences.html