如何确定哪个键在Spark的钥匙上进行



在sort%溢出过程中,哪个键是分区和花药的开始?

不管它是Spark Core(带有RDDS(还是Spark SQL(带有数据集(,默认分区是HashPartitioner,其中键的哈希提供了分区:

a org.apache.spark.partitioner使用Java的Object.hashcode实现基于哈希的分区。

相关内容

  • 没有找到相关文章

最新更新