我们有带有 HIVE 2.0 的 HDP 2.6 集群。我们在 Hide 中创建了集群分区内部表。我们需要知道HIVE中总表的大小。
我们已经针对相同的发出了分析命令。
ANALYZE TABLE A_ITT_ITEM_SALES COMPUTE STATISTICS FOR COLUMNS;
当我们尝试检查尺寸时 -
describe extended a_itt_item_sales
在详细的表格信息中,我得到 -
...parameters:{}, skewedInfo:SkewedInfo(skewedColNames:[], skewedColValues:[], skewedColValueLocationMaps:{}), storedAsSubDirectories:false), partitionKeys:[FieldSchema(name:trans_date, type:date, comment:null)], parameters:{transient_lastDdlTime=1529059590, last_modified_time=1529059590, last_modified_by=admin, serialization.null.format=}, viewOriginalText:null, viewExpandedText:null, tableType:MANAGED_TABLE)...
当表被聚集分区/压缩时,我们如何获得表的总大小?
hdfs dfs -du -s -h /users/hive/warehouse/A_ITT_ITEM_SALES
(使 HDFS 路径适应您的部署设置(