我正在编写一个Python脚本,该脚本通过Athena运行查询,将其输出到S3并下载到我的计算机中。我可以通过Athena运行我的查询,并将结果输出到S3中。所以我似乎不知道的下一步是如何在不知道密钥名称的情况下将其下载到我的计算机上?
有没有一种方法可以在输出到Athena后在我的python脚本中查找对象键?
我完成了什么:
# Output location and DB
s3_output = ‘s3_output_here’
database = ‘database_here’
# Function to run Athena query
def run_query(query, database, s3_output):
while True:
try:
response = client.start_query_execution(
QueryString=query,
QueryExecutionContext={
'Database': database
},
ResultConfiguration={
'OutputLocation': s3_output,
}
)
return response
break
except client.exceptions.TooManyRequestsException as e:
print('Too many requests, trying again after sleep')
time.sleep(100)
# Our SQL Query
query = """
SELECT *
FROM test
”””
print("Running query to Athena...")
res = run_query(query, database, s3_output)
我了解如何使用以下代码下载文件:
try:
s3.Bucket(BUCKET_NAME).download_file(KEY, ‘KEY_HERE’)
except botocore.exceptions.ClientError as e:
if e.response['Error']['Code'] == "404":
print("The object does not exist.")
else:
raise
那么,在运行完第一个完整的代码后,如何读取密钥名称呢?
您可以使用boto库提供的get_key命令获取密钥。这就是我从s3:下载东西的方式
with open("path/aws-credentials.json") as f:
data= json.load(f)
conn = boto.connect_s3(data["accessKeyId"], data["secretAccessKey"])
bucket = conn.get_bucket('your_bucket')
file_path = bucket.get_key('path/to/s3/file')
file_path.get_contents_to_filename('path/on/local/computer/filename')
如果您只是在测试一些东西,您可以将凭据硬编码到代码中,但如果您计划将其投入生产,最好将凭据外部存储在json文件中。