i我的数据群群集安装了Presto作为可选组件。我的数据存储在Google Cloud Storage(GCS(中,我可以使用Presto查询。但是,我找不到将查询结果写回GC的方法。如果我登录以主持节点并从那里运行presto命令,我可以写信给HDFS,但它无法识别任何GCS位置。
如何将Presto查询结果写入GCS?
您需要创建一个由GC支持的蜂巢外部表格,例如:
gcloud dataproc jobs submit hive
--cluster <cluster>
--execute "
CREATE EXTERNAL TABLE my_table(id INT, name STRING)
STORED AS PARQUET
location 'gs://<bucket>/<dir>/';"
然后将您的Presto查询结果插入表中。