数据结构-F#PurelyFunctionalDataStructures WeightBiasedLeftistHea



我正在研究Okasaki的纯功能数据结构,并试图构建F#实现。我还在复习书中列出的练习(有些很有挑战性)。我一直在练习3.4中,它要求修改WeightBiasedLeftistHeap的merge函数,使其在单个过程中执行,而不是原来的2个过程实现。

我还不知道该怎么做,希望能得到一些建议。在SO上还有另一篇文章,一个人在SML中通过几乎内联makeT函数来实现这一点。我开始走这条路(在评论的第3.4节"第一次尝试"中)。但放弃了这种方法,因为我认为这真的不是一次完成的(它仍然会一直走到到达一片叶子,然后展开并重建树)。我把它解释为仍然是两次合并,这是错的吗?

这是我完整实现WeightBiasedLeftistHeap的链接。

以下是我在F#中失败的尝试:

type Heap<'a> =
| E
| T of int * 'a * Heap<'a> * Heap<'a> 
module WeightBiasedLeftistHeap =
    exception EmptyException
    let weight h =
        match h with
        | E -> 0
        | T(w, _,_,_) -> w
    let makeT x a b =
        let weightA = weight a
        let weightB = weight b
        if weightA >= weightB then
            T(weightA + weightB + 1, x, a, b)
        else
            T(weightA + weightB + 1, x, b, a)
    // excercise 3.4 first try
    //    let rec merge3_4 l r =
    //        match l,r with
    //        | l,E -> l
    //        | E,r -> r
    //        | T(_, lx, la, lb) as lh, (T(_, rx, ra, rb) as rh) ->
    //            if lx <= rx then
    //                let right = merge3_4 lb rh
    //                let weightA = weight la
    //                let weightB = weight right
    //
    //                if weightA >= weightB then
    //                    T(weightA + weightB + 1, lx, la, right)
    //                else
    //                    T(weightA + weightB + 1, lx, right, la)
    //            else
    //                let right = merge3_4 lh rb
    //                let weightA = weight ra
    //                let weightB = weight right
    //
    //                if weightA >= weightB then 
    //                    T(weightA + weightB + 1, rx, ra, right)
    //                else
    //                    T(weightA + weightB + 1, rx, right, ra)
    // excercise 3.4 second try (fail!)
    // this doesn't work, I couldn't figure out how to do this in a single pass
    let merge3_4 l r =
        let rec merge' l r value leftChild  =
            match l,r with
            | l,E -> makeT value leftChild l
            | E,r -> makeT value leftChild r
            | T(_, lx, la, lb) as lh, (T(_, rx, ra, rb) as rh) ->
                if lx <= rx then
                    merge' lb rh lx la   //(fun h -> makeT(lx, la, h))
                else
                    merge' lh rb rx ra   //(fun h -> makeT(rx, ra, h))
        match l, r with
        | l, E -> l
        | E, r -> r
        | T(_, lx, la, lb) as lh, (T(_, rx, ra, rb) as rh) ->
            let lf = fun h -> makeT(lx, la, h)
            if lx <= rx then
                merge' lb rh lx la // (fun h -> makeT(lx, la, h))
            else
                merge' lh rb rx ra // (fun h -> makeT(rx, ra, h))
    let rec merge l r =
        match l,r with
        | l,E -> l
        | E,r -> r
        | T(_, lx, la, lb) as lh, (T(_, rx, ra, rb) as rh) ->
            if lx <= rx then
                makeT lx la (merge lb rh)
            else
                makeT rx ra (merge lh rb)
    let insert3_4 x h =
        merge3_4 (T(1,x,E,E)) h

第一个问题是:什么构成"一次通过"算法?可以自然地作为一个自上而下的循环来实现的东西就是合格的。相反,递归——天真地编译——通常有两个过程,一个在向下的过程中,另一个在向上的过程中尾递归可以很容易地编译成一个循环,通常是在函数语言中Tail递归modulo-cons是一种类似的优化,尽管不太常见。但是,即使您的编译器不支持尾部递归模cons,您也可以轻松地手动将这样的实现转换为循环。

尾部递归modulo-cons类似于普通的尾部递归,只是尾部调用被封装在构造函数中,构造函数可以在递归调用之前进行分配和部分填充。在这种情况下,您可能希望返回表达式类似于T (1+size(a)+size(b)+size(c),x,a,merge(b,c))。这里需要的关键见解(正如在另一个SO线程上的编辑中所提到的)是,您不需要执行合并来知道结果会有多大,也不需要知道它应该在新树的哪一边。这是因为merge(b,c)的大小始终是size(b)+size(c),可以在合并之外计算。

请注意,普通左堆的原始rank函数共享此属性,因此无法以这种方式进行优化。

那么,从本质上讲,您内联了makeT的两个调用,并将形式size(merge(b,c))的调用转换为size(b)+size(c)

一旦您进行了此更改,生成的函数将比原始函数明显延迟,因为它可以在评估递归合并之前返回结果的根。

类似地,在涉及锁和突变的并发环境中,新的实现可以通过获取和释放每个节点的锁来支持更大的并发性,而不是锁定整个树。(当然,这只对非常轻量级的锁有意义。)

我不确定我是否正确理解了这个问题,但这是我的尝试-目前,merge操作对merge执行递归调用(这是第一次),当它到达堆的末尾时(match中的前两种情况),它将新构建的堆返回给调用者,并调用makeT几次(这是第二次)。

我不认为我们需要简单地内联mMakeT(如果是的话,只需将inline添加到makeT中,这样做不会降低代码的可读性:-)。

不过,可以做的是修改merge函数,使其使用延续传递样式,其中"其余工作"作为函数传递给递归调用(因此,在第一次传递完成后,堆栈上没有待完成的工作)。可以这样做:

let rec merge' l r cont =
    match l,r with
    | l,E -> cont l // Return result by calling  the continuation
    | E,r -> cont r // (same here)
    | T(_, lx, la, lb) as lh, (T(_, rx, ra, rb) as rh) ->
        if lx <= rx then
            // Perform recursive call and give it 'makeT' as a continuation
            merge' lb rh (makeT lx la)
        else
            // (same here)
            merge' lh rb (makeT rx ra)
// Using 'id' as a continuation, we just return the 
// resulting heap after it is constructed
let merge l r = merge' l r id

我不完全相信这是正确的答案——它只执行一次传递,但(在延续中)聚合的工作量意味着传递要长两倍。然而,我看不出有什么方法可以让这件事变得更简单,所以这可能是正确的答案。。。

相关内容

  • 没有找到相关文章

最新更新