删除最近14天内创建的hive表(没有更新),这些表是在ABC DB
中创建的,使用/abc/pqr/xyz/NNN/table_name/
作为位置。这里NNN
是一个随机数(如123125547等)
我们可以用DROP TABLE [IF EXISTS] table_name;
但是我们需要识别具有上述约束的表
如果你有管理员权限,你可以连接到metastore db和搜索元数据,只是一个建议,不是一个具体的答案…
基于规则
HADOOP表是目录
我已经创建了一个shell脚本来执行以下步骤。步骤1。查找14天以来未被修改的所有目录。
步骤2。将真实的表和真实的文件夹分开执行"desc $dir_name "
2.2基于返回状态($?)将$dir_name重定向到两个文件(一个用于实际表,另一个用于目录)
步骤3。删除真实表文件中的所有表