如何在s3文件夹中搜索匹配的正则表达式,并解析文件



下面是s3文件夹:

s3://bucket-name/20210802-123429/DM/US/2021/08/02/12/test.json

20210802-123429是存放文件的归档作业。

我能做到的:

cred_obj = cred_conn.list_objects_v2(Bucket=cfg.Bucket_Details['extractjson'], Prefix="DM"+'/'+"US"+'/'+self.yr+'/'+self.mth+'/'+self.day+'/'+self.hr+'/')

问题说明:

但是,在上面的行中,我不确定如何匹配20210802的标准并解析"test.json">

list_objects_v2不支持RegEx匹配。搜索的唯一方法是使用前缀。因此,您必须知道前缀或前缀的一部分才能进行搜索。

timestr_arc = todays_dt.strftime("%Y%m%d")
cred_obj = cred_conn.list_objects_v2(Bucket=cfg.Bucket_Details['extractjson'], Prefix="DM"+'/'+"US"+'/'+str(self.timestr_arc))

这将检查特定的条件