删除五角形 etl 工具中的旧备份文件



我想知道如何使用水壶作业根据创建日期删除文件。我有一个日志文件夹,其中包含过去四年的日志文件。但我只想保留上周的日志文件。作业应删除所有超过一个月的日志文件。pentaho 作业中有一个删除文件选项。但是我们如何获取文件创建日期并相应地删除文件。

我用来创建水壶的分步过程:

  1. 获取文件名
  2. 获取系统信息
  3. 添加常量
  4. 数据库查找:在这里我使用 postgresql 它使用此数据库查找查找从数据库和日期插入数据库中的entity_name和attribute_name字段。
  5. 选择值:
  6. 计算器
  7. 筛选行
  8. 在结果中设置文件
  9. 使用选项删除处理文件。

我想问我有 eg:abcd_2018_06_05.backup 的文件名。 我必须使用硬核正则表达式来定义上面的文件名。谁能帮我定义它,以便它可以正确(file_name,len(file_name)-7)。

我知道如何在SQL查询中完成它,但在Penaho中我不知道。

获取文件名步骤还返回上次修改的时间戳。你不能用它代替吗?

像这样:

获取文件名 ->获取系统信息(获取当前日期) ->计算器(从当前日期中减去 7 天) ->过滤行(仅让超过 7 天的文件通过) ->进程文件:删除(删除旧文件。

或者,使用正则表达式步骤,您可以解析文件名,然后筛选行。

最新更新