Google DataProc Presto:如何将Presto查询结果编写到Google Cloud Storage



i我的数据群群集安装了Presto作为可选组件。我的数据存储在Google Cloud Storage(GCS(中,我可以使用Presto查询。但是,我找不到将查询结果写回GC的方法。如果我登录以主持节点并从那里运行presto命令,我可以写信给HDFS,但它无法识别任何GCS位置。

如何将Presto查询结果写入GCS?

您需要创建一个由GC支持的蜂巢外部表格,例如:

gcloud dataproc jobs submit hive 
    --cluster <cluster> 
    --execute "
        CREATE EXTERNAL TABLE my_table(id  INT, name  STRING)
        STORED AS PARQUET
        location 'gs://<bucket>/<dir>/';"

然后将您的Presto查询结果插入表中。

相关内容

  • 没有找到相关文章

最新更新