有没有办法在bigquery中找到列的大小?
我知道有一个关于information_schema
的公告,它也将具有列大小。但不确定什么时候可以使用。
那么,有什么可能的方法来解决这个问题吗?
您可以根据列的类型大小计算列的大小:
- INT64/INTEGER=8字节
- FLOAT64/FLOAT=8字节
- NUMERIC=16字节
- BOOL/BOOLEAN=1字节
- STRING=2字节+UTF-8编码的字符串大小
- BYTES=2字节+值中的字节数
- DATE=8字节
- DATETIME=8字节
- 时间=8字节
- TIMESTAMP=8字节
- STRUCT/RECORD=0字节+包含字段的大小
- GEOGRAPHY=16字节+24字节*地理类型中的顶点数(您可以使用ST_NumPoints函数(任何数据类型的空值计算为0字节
重复列存储为数组,并计算大小基于值的数量。例如,整数列(INT64(计算重复的(ARRAY(并包含4个条目作为32个字节(4个条目x 8个字节(。
你也可以这样做:
SELECT column_name FROM myDataset.myTable
BigQuery将显示它处理了多少数据。