后缀用雪花卸载至S3是什么意思



当我这样卸载到S3时:

COPY INTO '@stage/foobar'
FROM some.table
file_format = (type = csv,
               RECORD_DELIMITER = 'n',
               FIELD_DELIMITER=',',
               FIELD_OPTIONALLY_ENCLOSED_BY='"')
SINGLE = FALSE
HEADER = TRUE

我在S3上获得了多个文件。我两次执行了这种类型的转储,两次都是foobar_[digit]_[digit]_[digit].csv.gz,但它们看起来与众不同:

# files dumped the first time
foobar_0_0_0.csv.gz
foobar_0_1_0.csv.gz
foobar_0_2_0.csv.gz
foobar_0_3_0.csv.gz
foobar_0_4_0.csv.gz
foobar_0_5_0.csv.gz
foobar_0_6_0.csv.gz
foobar_0_7_0.csv.gz
foobar_1_0_0.csv.gz
foobar_1_2_0.csv.gz
foobar_1_3_0.csv.gz
foobar_1_4_0.csv.gz
foobar_1_5_0.csv.gz
foobar_1_7_0.csv.gz
# files dumped the second time
foobar_0_1_0.csv.gz
foobar_0_2_0.csv.gz
foobar_0_3_0.csv.gz
foobar_0_4_0.csv.gz
foobar_0_5_0.csv.gz
foobar_0_6_0.csv.gz
foobar_0_7_0.csv.gz
foobar_1_0_0.csv.gz
foobar_1_1_0.csv.gz
foobar_1_2_0.csv.gz
foobar_1_3_0.csv.gz
foobar_1_4_0.csv.gz
foobar_1_7_0.csv.gz

后缀是什么意思?

有三件事使我感到困惑:

  1. 最后一个数字不使用
  2. 第二个数字开始计算(0-7(,但停在7.
  3. 为什么第二个转储不存在0_0_0

这些后缀只是为了确保跨并行执行的唯一名称,但除此之外并不重要。您可以使用MAX_FILE_SIZE复制选项调整其在卸载期间创建的文件数量,或通过设置SINGLE = TRUE禁用将卸载列入多个文件。

https://docs.snowflake.net/manuals/user-guide/data-unload-overview.html#bulk-unloading-into-into-into-single-single-multiple-multiple-files

相关内容

  • 没有找到相关文章

最新更新