我正在处理一个巨大的数据集,该数据集在Hive中有超过10k行和600多列。存在多个行-列,其对于所有行具有NULL
值。如何获取只有NULL
值的所有列的列表?
使用count(col)
对某列的所有NOT NULL
行进行计数。
具有所有NULL
的列将具有0
计数:
select
count(col1) as col1_cnt,
count(col2) as col2_cnt,
...
count(colN) as colN_cnt
from table