为什么此JavaScript代码在Node.js优化之后运行较慢



我正在使用JavaScript和node.js创建解决方案,当我遇到一个有趣的问题时:在某些情况下,我的程序在同一数据集上的运行速度是慢的两倍。

我将其剥离,直到我到达了一个最小的例子,该示例证明了行为:

function solve(arr) {
  const total = arr.reduce((a, c) => a + c, 0);
  const count = arr.length;
  for (let i = 0; i < total; i++) {
    for (let j = 0; j < count; j++) {
      // calculate some stuff
    }
  }
}
for (let i = 0; i < 10; i++) {
  // generate some sample data (array of 5000 random numbers 1-10)
  const data = [];
  for (let i = 0; i < 5000; i++) {
    data.push(Math.floor(Math.random() * 10) + 1);
  }
  const start = new Date();
  solve(data);  // run solve on the data
  console.log(`${i + 1}: ${new Date() - start}ms`);
}

这是使用Node V10.15.1:

运行node --trace-opt code.js的输出
[marking 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> for optimized recompilation, reason: small function, ICs with typeinfo: 5/7 (71%), generic ICs: 0/7 (0%)]
[compiling method 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> using TurboFan OSR]
[optimizing 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> - took 1.453, 0.702, 0.082 ms]
1: 86ms
[marking 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> for optimized recompilation, reason: hot and stable, ICs with typeinfo: 22/23 (95%), generic ICs: 1/23 (4%)]
[compiling method 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> using TurboFan]
[optimizing 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> - took 0.159, 0.632, 0.096 ms]
2: 82ms
3: 80ms
[compiling method 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> using TurboFan OSR]
[optimizing 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> - took 0.592, 2.312, 0.154 ms]
4: 245ms
5: 243ms
6: 236ms
7: 237ms
8: 240ms
9: 246ms
10: 239ms

在前三个迭代中,运行时间约为80ms,但就在第四次迭代Node重新编译并优化了一种方法,并且从上开始,代码运行速度约3倍。 p>通常,当Node进行运行时分析,重新编译和优化时,一切运行速度更快。

谁能解释为什么Node优化在这种情况下会使情况变得更糟?


请注意,如果更改了示例代码以通过迭代而不是使用reduce来计算total,则优化会根据预期提高性能(运行时间下降到60ms左右):

let total = 0;
for (let v of arr) total += v;

我提交了一个错误报告,并从Chromium dev获得以下答复:

一些阵列内置的二手分支提示用于循环界限, 在嵌入式内置之后导致所有代码延期 代码。这对性能有害。

因此,事实证明,这是TurboFan编译器的已知问题,并且已经创建了修复程序并正在测试:

此CL删除 提示在Micro上改善了代码计划的大量计划 链接错误的基准为3倍。

最新更新