筛选对具有多个值的 crosstab() 查询的结果的意外影响



我有一个类似于我上一个问题中的crosstab()查询:
过滤对 crosstab() 查询结果的意外影响

常见情况是过滤具有倍数值extra1字段:extra1 IN(value1, value2...)。对于extra1过滤器中包含的每个值,我添加了一个排序表达式,如下所示(extra1 <> valueN),如上面提到的帖子所示。生成的查询如下所示:

SELECT *
FROM crosstab(
'SELECT row_name, extra1, extra2..., another_table.category, value
FROM   table t
JOIN   another_table ON t.field_id = another_table.field_id
WHERE  t.field = certain_value AND t.extra1 IN (val1, val2, ...) --> more values
ORDER  BY row_name ASC, (extra1 <> val1), (extra1 <> val2)', ... --> more ordering expressions
'SELECT category_name FROM category_name WHERE field = certain_value'
) AS ct(extra1, extra2...)
WHERE extra1 = val1; --> condition on the result

排序表达式中包含的extra1的第一个值value1,得到正确的结果行。但是,以下value2value3...得到错误的结果数,导致每个结果上的行数减少。为什么?

更新:

将其作为我们的源表(table t):

+----------+--------+--------+------------------------+-------+
| row_name | Extra1 | Extra2 | another_table.category | value |
+----------+--------+--------+------------------------+-------+
| Name1    | 10     | A      | 1                      | 100   |
| Name2    | 11     | B      | 2                      | 200   |
| Name3    | 12     | C      | 3                      | 150   |
| Name2    | 11     | B      | 3                      | 150   |
| Name3    | 12     | C      | 2                      | 150   |
| Name1    | 10     | A      | 2                      | 100   |
| Name3    | 12     | C      | 1                      | 120   |
+----------+--------+--------+------------------------+-------+

这作为我们的类别表:

+-------------+--------+
| category_id | value  |
+-------------+--------+
| 1           | Cat1   |
| 2           | Cat2   |
| 3           | Cat3   |
+-------------+--------+

使用CROSSTAB,这个想法是得到一个这样的表:

+----------+--------+--------+------+------+------+
| row_name | Extra1 | Extra2 | cat1 | cat2 | cat3 |
+----------+--------+--------+------+------+------+
| Name1    | 10     | A      | 100  | 100  |      |
| Name2    | 11     | B      |      | 200  | 150  |
| Name3    | 12     | C      | 120  | 150  | 150  |
+----------+--------+--------+------+------+------+

这个想法是能够过滤结果表,以便我得到Extra1值为1011的列的结果,如下所示:

+----------+--------+--------+------+------+------+
| row_name | Extra1 | Extra2 | cat1 | cat2 | cat3 |
+----------+--------+--------+------+------+------+
| Name1    | 10     | A      | 100  | 100  |      |
| Name2    | 11     | B      |      | 200  | 150  |
+----------+--------+--------+------+------+------+

问题是在我的查询中,我得到不同的结果大小,Extra110为值,Extra111为值。有了(Extra1 <> 10)我可以在Extra1上获得该值的正确结果大小,但在11值的情况下则不能。

这是一个小提琴,更详细地演示了这个问题:

https://dbfiddle.uk/?rdbms=postgres_11&fiddle=5c401f7512d52405923374c75cb7ff04

所有"额外"列都是从组的第一复制的(如我之前的回答所指出的)

当您使用以下命令进行筛选时:

.... WHERE extra1 = 'val1';

。在同一列上添加更多ORDER BY表达式是没有意义的。只有源组中至少有一个extra1 = 'val1'的行才能存活。

从您的各种评论中,我想您可能希望查看extra的所有不同现有值 - 在WHERE子句中过滤的集合内 - 对于同一unixdatetime。如果是这样,请在透视之前聚合。喜欢:

SELECT * 
FROM   crosstab(
$$
SELECT unixdatetime, x.extras, c.name, s.value
FROM  (
SELECT unixdatetime, array_agg(extra) AS extras
FROM  (
SELECT DISTINCT unixdatetime, extra
FROM   source_table   s
WHERE  extra IN (1, 2)     -- condition moves here
ORDER  BY unixdatetime, extra
) sub
GROUP  BY 1
) x
JOIN   source_table   s USING (unixdatetime)
JOIN   category_table c ON c.id = s.gausesummaryid
ORDER  BY 1
$$
, $$SELECT unnest('{trace1,trace2,trace3,trace4}'::text[])$$
) AS final_result (unixdatetime int
, extras int[]
, trace1 numeric
, trace2 numeric
, trace3 numeric
, trace4 numeric);

旁白:以下相关答案中给出的关于第二个函数参数的建议也适用于您的情况:

  • PostgreSQL 交叉表无法按预期工作

我在上面演示了一个静态的第二个参数查询。在使用它时,您根本不需要加入category_table。同样,更短更快,但是:

SELECT * 
FROM   crosstab(
$$
SELECT unixdatetime, x.extras, s.gausesummaryid, s.value
FROM  (
SELECT unixdatetime, array_agg(extra) AS extras
FROM  (
SELECT DISTINCT unixdatetime, extra
FROM   source_table
WHERE  extra IN (1, 2)     -- condition moves here
ORDER  BY unixdatetime, extra
) sub
GROUP  BY 1
) x
JOIN   source_table s USING (unixdatetime)
ORDER  BY 1
$$
,  $$SELECT unnest('{923,924,926,927}'::int[])$$
) AS final_result (unixdatetime int
, extras int[]
, trace1 numeric
, trace2 numeric
, trace3 numeric
, trace4 numeric);

db<>小提琴在这里- 在你的小提琴底部添加了我的查询。

最新更新