处理黑斑羚中的空数据



我正在尝试了解黑斑羚中算术运算的行为

我正在使用下表

╔════╦══════════════╦══════════╗
║ id ║  name        ║ salary   ║
╠════╬══════════════╬══════════╣
║  1 ║  cde         ║ 5636     ║
║  2 ║  asd         ║  148     ║
║  3 ║  pwe         ║  null    ║
║  4 ║  lmn         ║  959     ║
╚════╩══════════════╩══════════╝

当我执行以下查询时

select salary+20 as sum1 from table where id=3;

它返回我

     |sum1
  ---|-----
   1 |NULL

当我在列上运行总和时

select sum(salary) as sum1 from table;
     |sum1
  ---|-----
   1 |6743

我无法理解相同的算术运算的行为有何不同

你有没有尝试过这样的事情:

select sum(COALESCE(salary,0)) as sum1 from table;

这应确保返回的值是一个数字。与左联的答案类似。您也可以使用 case 语句或 where 语句执行此操作。

源:

https://www.cloudera.com/documentation/enterprise/5-4-x/topics/impala_conditional_functions.html

NULL 不是零 (0),零也不是 NULL,它是一个值,这是最重要的。NULL 是没有值,什么都没有。 sum()仅聚合值。如果数据集中没有任何值,则返回 NULL。如果是一些值,sum() 将聚合它们,忽略空值。如果要将其NULL转换为零,请使用NVL()函数:

select nvl(sum(salary),0) as sum1 from table where ...

如果数据集中没有值,则此查询将返回 0。

这些是不同的算术查询。

在第一个查询中,您希望数据库从第 3 行返回salary+20。那么第 3 行的salaryNULL.因此,数据库将看到该NULL+20=NULL并返回NULL

但是在第二个查询中:sum(salary) from table;要求数据库对整个salary列求和并将其返回给您。所以它看着它并做5636+148+959=6743(忽略NULL)。

总之,在第一个查询中,您正在执行一个基本的算术运算符。但第二个查询sum()是应用于返回行的运算符。作为更好的测试,请尝试运行select sum(salary) as sum1 from table where id=3,看看您可以更好地了解正在发生的事情。

相关内容

  • 没有找到相关文章

最新更新