我正在Win7和Linux Ubuntu 16上测试一些简单的基准测试计算,以比较时间,并且想知道,Win似乎比Linux快得多。
Win和Linux x64都托管同一台机器,CPU时钟设置相同。我在 Win 上使用带有 -O2(最大化速度)优化的 VC2010,在 Linux 上使用带有 -O3 的 gcc5。Win的结果是2375ms,Linux的结果是2800ms。Linux甚至使用-Ofast优化也会滞后。无论如何,gcc 和 g++ 都给出了相同的结果。
我解释这种行为的假设是 VC 和 Win 运行时针对 x86/64 进行了极其优化。
有人可以给出为什么会发生这种情况的建议吗?
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
#include <math.h>
#define Pk 41
#define Lmz 101
#define Mmz 101
#define Nmz 101
// input data
float US[Pk][Lmz][Mmz][Nmz], VS[Pk][Lmz][Mmz][Nmz], HS[Pk][Lmz][Mmz][Nmz], QS[Pk][Lmz][Mmz][Nmz], TS[Pk][Lmz][Mmz][Nmz];
float F_X[Mmz][Nmz];
float Zmz[Nmz];
// output data
float Q[Pk][Lmz][Mmz][Nmz];
void Init() {
int h, k, j, i;
for (h = 0; h < Pk; h++)
for (k = 0; k < Lmz; k++)
for (j = 0; j < Mmz; j++)
for (i = 0; i < Nmz; i++) {
US[h][k][j][i] = 1+sin((float)i*j+i-k-h);
VS[h][k][j][i] = 2+cos((float)3*i*h-j+h*k);
HS[h][k][j][i] = 3+sin((float)2*i*k+j*h);
QS[h][k][j][i] = 4+cos((float)i+j+k+h+10);
TS[h][k][j][i] = 5+sin((float)(j+i)*k-h);
}
for (j = 0; j < Mmz; j++)
for (i = 0; i < Nmz; i++)
F_X[j][i] = sin((float)i*j-i+123);
for (i = 0; i < Nmz; i++)
Zmz[i] = cos((float)2*i);
}
void Calc() {
int h, k, j, i;
float Rs = 0, a = 0, Tp = 0, Tv = 0;
for(h = 0; h < Pk; h++)
{
for(k = 0; k < Lmz; k++)
{
for(j = 0; j < Mmz; j++)
{
for(i = 0; i < Nmz; i++)
{
a = (1.23 + US[h][k][j][i] / 0.321) * Rs * VS[h][k][j][i];
Tp = TS[h][k][j][i] * pow( 1000. / HS[h][k][j][i], 2./7. );
Tv = Tp * (1. + 0.6078 * QS[h][k][j][i]);
Q[h][k][j][i] = a - (0.5 * Tv + (1. - Zmz[k]) * 9.8 * F_X[j][i] / 0.321);
}
}
}
}
}
int main() {
int h, k, j, i;
clock_t timer;
Init();
timer = clock();
Calc();
printf("ncalc time t%fnn", (float)(clock() - timer));
return 0;
}
我认为您的测试完全有效,测试结果准确。你没有做错任何事。您正在测试一个完整的工具链,而不仅仅是操作系统。造成差异的主要原因是 Linux 无法利用硬件加速进行浮点运算的可悲事实。或者图形。trig 函数的实现可能存在差异,但我怀疑这些差异很小。大多数编译器提供的运行时只使用 Fortran 设计人员首先规定的原始实现,因为没有理由不这样做。