我正在用C编写一个小型基准库,用于对单个函数进行基准测试。它的工作方式是,为基准测试函数提供一个指向不带参数和迭代次数的void
函数的指针。然后,该函数返回包含
struct
。然而,当查看单个结果时,我看到第一次调用占用了很多时间,然后调用占用了很少的时间。
所以我想知道:
- 这是由于指令缓存?
- 如果对第一个问题是肯定的,那么基准测试工具通常是如何符合这个要求的?第一个电话不包括在内吗?
- 如果是第一个问题,是否存在缓存不应用于函数的情况?
- 如果第一个问题是,缓存是否发生在整个函数或函数段?
- 如果对第一个问题的回答是肯定的,还有什么我应该考虑的,我应该阅读和更好地理解?
数据和代码
查询时间的函数:
double currentTime()
{
struct timeval time;
struct timezone timezone;
gettimeofday(&time, &timezone);
return time.tv_sec + time.tv_usec * 1e-6;
}
测试结果:
0.000319
0.000000
0.000000
0.000000
0.000001
0.000000
0.000000
0.000000
0.000000
0.000000
Total time: 0.000320
Average time: 0.000032
Worst time: 0.000319
Best time: 0.000000
没有优化标志的结果:
13.425430
13.349757
13.482863
13.129472
13.020705
13.672982
13.027595
13.139602
13.028962
13.107892
Total time: 132.385260
Average time: 13.238526
Worst time: 13.672982
Best time: 13.020705
产生此结果的被测试函数:
void test()
{
unsigned int i = 0;
while(i++ < UINT_MAX){}
}
文件:
CC = gcc
MAIN = main.c
SOURCES = lib/tb_time_handling.c lib/tb_rendering.c tb_benching.c
OUTPUT = main
FLAGS = -Wall -pedantic -O2
all: main
main:
$(CC) $(MAIN) $(SOURCES) -o $(OUTPUT) $(FLAGS)
Github repo with all code:
https://github.com/Ancide/TinyBench 编辑:忘了提到编译器和编译器标志编辑2:添加git repo与所有的代码,以防有人想看到所有的
编辑3:添加不带O2标志的结果
这在虚拟内存操作系统中是正常的。第一次调用函数往往会产生一个页面错误,它会将可执行文件中的代码加载到RAM中。如果您对实际的代码性能感兴趣,那么您可以忽略第一个调用。如果你对实际的性能测量感兴趣,那么你就不要忽视它。