Apache Storm并行是如何工作的



我是Apache风暴的新手,想知道并行提示是如何工作的。

例如,我们有一个包含两个元组的流<4>lt;6>,一个喷口,每个执行器只有一个任务,我们有一个螺栓来对元组执行一些操作,并行性提示为2,所以我们有两个螺栓的执行器,即A和B,关于这一点,我有3个问题。

  1. 考虑到上述场景,我们的包含值4的元组由A处理,而另一个包含值6的元组由B处理
  2. 如果以这种方式进行处理,即问题(1(中提到的处理,那么它不会影响顺序重要的操作吗
  3. 如果不以这种方式进行处理,意味着两个元组都将进入同一个执行器,那么并行的好处是什么呢
  1. 考虑到上述场景,我们的包含值4的元组是否可能由A处理,另一个包含值6的元组是否由B处理

是。

  1. 如果以这种方式进行处理,即问题(1(中提到的处理,那么它不会影响重要顺序的操作吗

这取决于情况。你很可能可以控制你嘴里元组的顺序。如果序列很重要,建议减少并行性或使用字段分组,以确保相互依赖的元组进入同一执行器。如果序列无关紧要,请使用shuffleGrouping或localOrShuffleGroupation从并行处理中获得好处。

  1. 如果不以这种方式进行处理,意味着两个元组都将进入同一个执行器,那么并行的好处是什么

如果两个元组都去了同一个执行器,显然没有任何好处。

最新更新