下面是我试图理解中位数算法中位数的代码(使用大小为 5 的块)。我了解如何获取输入的中位数,但我不确定如何对块进行编码以继续递归输入,直到我只有中位数。然后在获得中位数后,我不确定如何将其用作枢轴来丢弃无用的信息来对输入进行分区。 getMediansArray
返回大小为 ceil(input.length/5) 的数组,getMedians
只返回数组的中位数(仅用于长度为 <= 5 的数组)。
public static int[] findKthElement(int[] input, int k) {
int numOfMedians = (int) Math.ceil(input.length/5.0);
int[] medians = new int[numOfMedians];
medians = getMediansArray(input, medians)
// (1) This only gets the first iteration of medians of the
// input. How do I recurse on this until I just have one median?
// (2) how should I partition about the pivot once I get it?
}
public static int[] getMediansArray(int[] input, int[] medians) {
int numOfMedians = (int) Math.ceil(input.length/5.0);
int[] five = new int[5];
for (int i = 0; i < numOfMedians; i++) {
if (i != numOfMedians - 1) {
for (int j = 0; j < 5; j++) {
five[j] = input[(i*5)+j];
}
medians[i] = getMedian(five);
} else {
int numOfRemainders = input.length % 5;
int[] remainder = new int[numOfRemainders];
for (int j = 0; j < numOfRemainders; j++) {
remainder[j] = input[(i*5)+j];
}
medians[i] = getMedian(five);
}
}
return medians;
}
public static int getMedian(int[] input) {
Arrays.sort(input);
if (input.length % 2 == 0) {
return (input[input.length/2] + input[input.length/2 - 1]) / 2;
}
return input[input.length/2];
}
中位数基本上只是改进的快速选择算法(http://en.wikipedia.org/wiki/Quickselect)。虽然快速选择具有 O(n) 的平均时间复杂度,但对于棘手的输入,它可能会减慢到 O(n^2)。
找到中位数后所做的只不过是快速选择算法的迭代。中位数有一个很好的属性,它将始终大于 30% 的元素和小于 30% 的元素。这保证了使用中位数作为枢轴的快速选择将在 O(n) 的最差时间复杂度下运行。参考: http://en.wikipedia.org/wiki/Median_of_medians
我建议您从实现快速选择开始。完成此操作后,可以使用已在快速选择的每个步骤中选择透视的代码。
如果我没记错的话(刷新我的记忆),中位数的中位数选择一个近似的中位数。 我不明白如何使用它来选择第 k 个元素。