值得注意的是,count(*)
没有给出更新后的计数,在用包含不同记录数的新文件替换已经存在的数据文件后,在HDFS的外部表位置。
是否有办法刷新这个值?或者,它会在可配置的持续时间后自动刷新吗?
Hive维护一些表统计数据的缓存,包括行数。尝试执行ANALYZE TABLE tablename COMPUTE STATISTICS
来更新这些缓存的统计数据并再次运行查询。