Boyer-Moore多数投票算法的内存复杂度



根据我的理解,要找到多数元素,Boyer-Moore多数投票算法是O(1),即它是常数,与输入的大小不成比例。那么为什么这个维基链接提到对数空间{displaystyle O(log n)} O(log n)

下面是供参考的程序

public class MajorityElement {
    /* Function to print Majority Element */
    void printMajority(int a[], int size) {
        /* Find the candidate for Majority */
        int cand = findCandidate(a, size);
        /* Print the candidate if it is Majority */
        if (isMajority(a, size, cand))
            System.out.println(" " + cand + " ");
        else
            System.out.println("No Majority Element");
    }
    /* Function to find the candidate for Majority */
    int findCandidate(int a[], int size) {
        int maj_index = 0, count = 1;
        int i;
        for (i = 1; i < size; i++) {
            if (a[maj_index] == a[i])
                count++;
            else
                count--;
            if (count == 0) {
                maj_index = i;
                count = 1;
            }
        }
        return a[maj_index];
    }
    /*
     * Function to check if the candidate occurs more than n/2 times
     */
    boolean isMajority(int a[], int size, int cand) {
        int i, count = 0;
        for (i = 0; i < size; i++) {
            if (a[i] == cand)
                count++;
        }
        if (count > size / 2)
            return true;
        else
            return false;
    }

这就是为什么维基百科并不总是值得信赖的原因,至少在读者没有批判性思维的情况下是这样。(这不应该被视为不使用维基百科的理由;这是一个非常有价值的资源,感谢一个庞大而忠诚的志愿者贡献者团队。

有两种常用的模型用于测量空间和时间复杂性:均匀成本模型和对数成本模型。统一成本模型假设单个值的存储成本为Θ(1)(无论该值的大小),单个简单算术计算的时间复杂度也为Θ(1)。如果值非常大,那么这些简化是不正确的,因此可能需要使用对数模型。在对数模型中,我们不是通过值的计数来衡量问题的大小,而是通过值的总位数来衡量问题的大小。(另一篇维基百科文章提供了对这些模型的讨论。参见参考资料

这对简单的算术几乎没有影响。将两个N位相加的代价是Θ(N),将一个总大小为N位的数向量相加的代价是Θ(N),就像将问题的大小用数值来衡量,将两个值相加的代价是Θ(1)的简化假设一样。但是如果涉及到乘法和除法,复杂性的计算就会变得更加复杂,除非数字非常非常大,否则真的不值得这么做,例如,在各种加密算法中,包括对大小为数千位的值的操作。

虽然有些算法涉及对足够大的数字进行算术运算,需要考虑到精确的分析,但实际上没有实用的算法涉及如此多的输入,以至于需要考虑值的地址大小(在随机存取机中)。在整个宇宙中没有2个256个亚原子粒子,因此完全有理由假设一个有限位宽的寄存器足以用于任何寻址目的,包括计算参与对象的数量。

因此,仅仅因为计数器在某些可选域中可能具有任意数量的比特,就将需要维护输入计数的算法分类为Θ(log N)(或O(log N)),这充其量是迂腐的,(在我看来)对理解给定算法的复杂性没有任何帮助。

尽管如此,学究和任何人一样有权利为维基百科做出贡献;事实上,可以从理论上说,维基百科文化会招致迂腐。这仍然需要与维基百科坚持作者不包括"原创研究"相平衡,这将包括(再次,在我看来)以一种与通常发表的结果相矛盾的方式重新解释算法的存储复杂性。(这也许可以解释维基百科文章中"需要引用"的标记。)

这是因为变量count需要O(log(n))位来存储候选对象的出现次数。当然,在您的日常测试中,您不太可能尝试使用超过2^32(或类似的)单元格的数组。

最新更新