我正在编译以下简单的演示函数:
int add(int a, int b) {
return a + b;
}
当然,这个函数是内联的,但我们假设它是动态链接的,或者由于其他原因没有内联。在禁用优化的情况下,编译器会生成预期的代码:
00000000 <add>:
0: 55 push ebp
1: 89 e5 mov ebp,esp
3: 8b 45 0c mov eax,DWORD PTR [ebp+0xc]
6: 03 45 08 add eax,DWORD PTR [ebp+0x8]
9: 5d pop ebp
a: c3 ret
由于该函数内部没有函数调用,0、1和9处的指令似乎没有任何用途。由于禁用了优化,因此这是可以接受的。
但是,在使用-Os -s
优化大小的同时进行编译时,会生成完全相同的代码。使用这些选项将函数的大小增加66%似乎相当浪费。
为什么代码没有优化为以下内容?
00000000 <add>:
0: 8b 45 0c mov eax,DWORD PTR [esp+0x8]
3: 03 45 08 add eax,DWORD PTR [esp+0x4]
6: c3 ret
编译器是认为这不值得优化,还是与函数对齐等其他细节有关?
这样做是为了保留调试器逐步执行代码的能力。
如果您真的想禁用此功能,请尝试-fomit-frame-pointer
。
使用-Os -fomit-frame-pointer -S -masm=intel
编译上述代码得到的结果是:
.file "frame.c"
.intel_syntax noprefix
.text
.globl _add
.def _add; .scl 2; .type 32; .endef
_add:
mov eax, DWORD PTR [esp+8]
add eax, DWORD PTR [esp+4]
ret
.ident "GCC: (rev0, Built by MinGW-builds project) 4.8.0"
函数进入时,EBP的值未知。代码可以使用mov eax,dword ptr [esp+8]
,而不必使用BP
寄存器,但许多调试工具都假设每个局部变量相对于某个寄存器的偏移量是固定的。即使编译器可以跟踪推送到堆栈上的内容并适当调整索引偏移量,调试器也可能无法做到这一点