在构建昂贵密钥映射时正确利用并行性?

我正在用Haskell编写彩虹表的玩具实现。主要的数据结构是一个严格的Map h c，包含大量的对，由随机值c生成：

import qualified Data.Map as M
import System.Random
table :: (RandomGen g, Random c) => Int -> g -> Map h c
table n = M.fromList . map (c -> (chain c, c)) . take n . randoms

其中chain的计算成本非常高。主导计算时间的部分令人尴尬地并行，因此如果并行运行，我希望内核数量会准线性加速。

但是，我希望将计算的对立即添加到表中，而不是累积在内存中的列表中。应该注意的是，可能会发生冲突，在这种情况下，应尽快删除冗余链。堆分析确认情况确实如此。

我从Control.Parallel.Strategies中找到了parMap，并尝试将其应用于我的表构建函数：

table n = M.fromList . parMap (evalTuple2 rseq rseq) (c -> (chain c, c)) . take n . randoms

但是，运行-N，我最多只能达到 1.3 核心使用率。堆分析至少表明中间列表不驻留在内存中，但 '-s' 也报告创建了 0 个火花。我使用parMap怎么可能？正确的方法是什么？

编辑：chain定义为：

chain :: (c -> h) -> [h -> c] -> c -> h
chain h = h . flip (foldl' (flip (.h)))

其中(c -> h)是目标哈希函数，从明文到哈希，[h -> c]是一系列减速器功能。我希望实现在c和h上保持通用，但为了进行基准测试，我对两者都使用严格的字节串。

这是我想到的。让我知道基准是如何工作的：

#!/usr/bin/env stack
{- stack --resolver lts-14.1 script --optimize
--package scheduler
--package containers
--package random
--package splitmix
--package deepseq
-}
{-# LANGUAGE BangPatterns #-}
import Control.DeepSeq
import Control.Scheduler
import Data.Foldable as F
import Data.IORef
import Data.List (unfoldr)
import Data.Map.Strict as M
import System.Environment (getArgs)
import System.Random as R
import System.Random.SplitMix

-- for simplicity
chain :: Show a => a -> String
chain = show
makeTable :: Int -> SMGen -> (SMGen, M.Map String Int)
makeTable = go M.empty
where go !acc i gen
| i > 0 =
let (c, gen') = R.random gen
in go (M.insert (chain c) c acc) (i - 1) gen'
| otherwise = (gen,  acc)
makeTablePar :: Int -> SMGen -> IO (M.Map String Int)
makeTablePar n0 gen0 = do
let gens = unfoldr (Just . splitSMGen) gen0
gensState <- initWorkerStates Par ((WorkerId wid) -> newIORef (gens !! wid))
tables <-
withSchedulerWS gensState $ scheduler -> do
let k = numWorkers (unwrapSchedulerWS scheduler)
(q, r) = n0 `quotRem` k
forM_ ((if r == 0 then [] else [r]) ++ replicate k q) $ n ->
scheduleWorkState scheduler $ genRef -> do
gen <- readIORef genRef
let (gen', table) = makeTable n gen
writeIORef genRef gen'
table `deepseq` pure table
pure $ F.foldl' M.union M.empty tables
main :: IO ()
main = do
[n] <- fmap read <$> getArgs
gen <- initSMGen
print =<< makeTablePar n gen

关于实施的几点说明：

不要使用random发电机，它很慢，splitmix快 x200
在makeTable中，如果您希望立即丢弃重复的结果，则需要手动循环或展开。但由于我们需要返回生成器，我选择了手动循环。
为了尽量减少线程之间的同步，将为每个线程构建独立的映射，并在最后删除重复项，当生成的映射合并在一起时。

相关内容

最新更新

热门标签：