HPX是否提供基于任务的叉接并行性之上构建的任何类型的并行化迭代函数,该函数还允许您控制所使用的粒度? 类似于TBB的parallel_for或Cilk的cilk_for。
确实如此。我们对标准化委员会正在考虑的内容进行了一些扩展。HPX 引入了ExecutorParameters
的概念,除其他功能外,它还允许控制迭代并行化的粒度大小。例如:
std::vector<int> v = { ... };
hpx::parallel::static_chunk_size scs;
hpx::parallel::for_each(
hpx::parallel::execution::par.with(scs),
v.begin(), v.end(),
[](int val) { ... }
);
这会将迭代拆分为(num_iterations / 4 * cores)
循环迭代的任务。您还可以指定任务的大小:
hpx::parallel::static_chunk_size scs(100);
这将在每个任务中组合 100 次迭代。
其他现有的执行器参数例如dynamic_chunk_size
(类似于openmp的schedule(dynamic)
(和guided_chunk_size
(类似于openmp的schedule(guided)
(等。