我在和Presto一起玩。我上传了包含 10 列的镶木地板文件。我想使用 presto-cli 在元存储中创建具有 5 列的表(外部位置 s3(。看起来 presto 不支持这个? 有没有其他方法可以让它工作。
如果您使用的是镶木地板或 ORC 文件格式,这应该很容易实现。这是将元数据与实际数据分开的另一个优点。如注释中所述,您应该使用列名而不是索引来访问字段。
示例之一:
CREATE TABLE hive.web.request_logs (
request_time timestamp,
url varchar,
ip varchar,
user_agent varchar
)
WITH (
format = 'parquet',
external_location = 's3://my-bucket/data/logs/'
)
参考:
https://prestodb.github.io/docs/current/connector/hive.html#examples