Data.Vector.modify 在每次迭代时创建矢量副本

考虑这个例子：

import qualified Data.Vector.Unboxed as Vector
import Data.Vector.Unboxed (Vector)
import qualified Data.Vector.Unboxed.Mutable as MVector
process :: [Int] -> Vector Int -> Vector Int
process [] v = v
process (x:xs) v = process xs $ Vector.modify modify v
  where
  modify mv = do
    old <- MVector.read mv x
    MVector.write mv x (old + 1)
main :: IO ()
main = do
  print $ process [1, 1, 3, 1] $ Vector.replicate 10 0

在每次迭代的core中，我看到newByteArray#、copyByteArray#、readIntArray#、writeIntArray#和unsafeFreezeByteArray#的序列。它肯定会创建中间副本。

文档指出：

对矢量应用破坏性操作。操作将是如果安全，请就地执行，并将修改否则向量。

它实现为

modify p = new . New.modify p . clone

还有RULE

"clone/new [Vector]" forall p.
  clone (new p) = p

根据我（非常有限的）理解，两个连续modify不应该创建中间副本：

modify p2 . modify p1
=> new . New.modify p2 . clone . new . New.modify p1 . clone
=> new . New.modify p2 . New.modify p1 . clone

为什么它在process函数中不起作用？我认为它应该：

process [1, 2] v
=> process [2] $ Vector.modify modify v
=> process [] $ Vector.modify modify $ Vector.modify modify v
=> Vector.modify modify $ Vector.modify modify v
=> the same as above

我怎样才能让它工作？

我认为是

递归阻止了它。

源代码中没有任何地方说modify紧跟modify。函数的每次迭代都会再次调用modify，但这发生在运行时，而不是编译时。我认为这就是问题所在。如果你在一行中手动写入三个modify调用，它们会融合。

我想不出自动制作这个保险丝的方法。您当然可以手动调用clone并自己new，但我想不出让编译器为您执行此操作的方法。

你为什么不只产生一个调用modify？

import Control.Monad (forM_)
[...]
process :: [Int] -> Vector Int -> Vector Int
process xs v = Vector.modify modify v
  where
  modify mv = forM_ xs $  x -> do
    old <- MVector.read mv x
    MVector.write mv x (old + 1)

相关内容

最新更新

热门标签：