在sort%溢出过程中,哪个键是分区和花药的开始?
不管它是Spark Core(带有RDDS(还是Spark SQL(带有数据集(,默认分区是HashPartitioner,其中键的哈希提供了分区:
a org.apache.spark.partitioner使用Java的Object.hashcode实现基于哈希的分区。