当蜂巢中创建存储桶文件时



在蜂巢中的哪个阶段中,产生了存储桶文件?

create table emp( id int, name string, country string)
 clustered by( country)
INTO 2 BUCKETS
row format delimited
fields terminated by ','
stored as textfile ;

如果我有20个存储桶,只有4行才能创建多少个文件?

创建表格时会创建存储桶。它们将位于您的蜂巢仓库中,作为表目录中的独立文件。一旦您将新记录插入存储库表架将计算存储栏的值的哈希,并将获得存储桶文件的指针。对于您的20个存储桶,您将在开始时有20个空文件,但是您的4个记录的确切位置将取决于哈希函数在存储栏列值上的结果:

**record.country.value => hashfunction(record.country.value) = bucketNumber**

您可以按照本文中描述的步骤来重现它

相关内容

最新更新