为什么 Queue.poll 比 Iteration 快?(java.util.concurrent.Concurren



我有一段代码可以从队列中获取所有元素。 之后我不关心队列的状态,我可以放心,当我从中删除元素时,队列不会被修改。

我最初使用迭代器来拉取元素,因为我认为它会比轮询元素更快......

但我运行了以下测试:

ConcurrentLinkedQueue<Object> queue = new ConcurrentLinkedQueue<>();
for (int i=0; i < 1000000; i++)
    queue.add(new Object());
LinkedList<Object> list = new LinkedList<>();
long start = System.currentTimeMillis();
for (Object object: queue)
    list.add(object);
long time1 = System.currentTimeMillis() - start;
list = new LinkedList<>(); 
start = System.currentTimeMillis();
Object object;
while ((object = queue.poll()) != null)
    list.add(object);
long time2 = System.currentTimeMillis() - start;
System.out.println(time1 + " " + time2);

我得到了以下输出(平均超过 100 次运行)

1169 46

我的问题是:为什么轮询比迭代快? 这对我来说完全不直观,因为民意调查将不得不修改队列,迭代只需要查看状态。

编辑---格雷是对的

我在循环中运行它并获得了输出(应该首先这样做)

1180 46
1422 25
287 32
14 26
226 26
236 25
12 26
14 25
13 25
13 26
13 25
268 25
13 25
14 176
13 26
13 26
13 25
13 25
13 26
13 24
13 26
13 25
...

我的问题是:为什么轮询比迭代快?这对我来说完全不直观,因为民意调查将不得不修改队列,迭代只需要查看状态。

正如@csoroiu指出的那样,这似乎是一个热点编译器问题。考虑到 Java 的工作方式,在开始执行这样的定时调用之前"预热"应用程序非常重要。

如果我在一种方法中运行您的测试 100 次,我最初看到由于 GC 开销和其他 JVM 魔法而导致的性能大不相同。 但是,在方法末尾添加了一些.clear()方法和System.gc()后,性能数字与迭代器获胜更加一致:

108 143
89 152
83 148
78 140
79 153
90 155
...

有关更多详细信息,请参阅Peter的回答:Java中的CPU执行时间

有关如何正确进行此类微基准测试的更多信息,请参阅以下详尽的答案:如何在 Java 中编写正确的微基准测试?

相关内容

最新更新