我正在进行代码优化并了解gcc内部。我在我的程序中写了一个简单的表达式,我检查了这个表达式的gimple表示,我陷入了gcc为什么这么做的困境。假设我有一个表达式:
if(i < 9)
则在万向节表示中,它将被转换为
if(i <= 8)
我不知道gcc为什么这么做。这是某种优化吗?如果是,有人能告诉我它如何优化我们的程序吗?
规范化有助于检测CommonSubExpression,例如:
#include <stdio.h>
int main(void)
{
unsigned u, pos;
char buff[40];
for (u=pos=0; u < 10; u++) {
buff[pos++] = (u <5) ? 'A' + u : 'a' + u;
buff[pos++] = (u <=4) ? '0' + u : 'A' + u;
}
buff[pos++] = 0;
printf("=%s=n", buff);
return 0;
}
GCC-O1将把它编译成:
...
movl $1, %edx
movl $65, %ecx
.L4:
cmpl $4, %eax
ja .L2
movb %cl, (%rsi)
leal 48(%rax), %r8d
jmp .L3
.L2:
leal 97(%rax), %edi
movb %dil, (%rsi)
movl %ecx, %r8d
.L3:
mov %edx, %edi
movb %r8b, (%rsp,%rdi)
addl $1, %eax
addl $1, %ecx
addl $2, %edx
addq $2, %rsi
cmpl $10, %eax
jne .L4
movb $0, 20(%rsp)
movq %rsp, %rdx
movl $.LC0, %esi
movl $1, %edi
movl $0, %eax
call __printf_chk
...
GCC-O2实际上会删除整个循环,并用一系列赋值来替换它。
考虑以下C代码:
int i = 10;
if(i < 9) {
puts("1234");
}
还有等效的C代码:
int i = 10;
if(i <= 8) {
puts("asdf");
}
在没有优化的情况下,两者生成完全相同的装配序列:
40052c: c7 45 fc 0a 00 00 00 movl $0xa,-0x4(%rbp)
400533: 83 7d fc 08 cmpl $0x8,-0x4(%rbp)
400537: 7f 0a jg 400543 <main+0x1f>
400539: bf 3c 06 40 00 mov $0x40063c,%edi
40053e: e8 d5 fe ff ff callq 400418 <puts@plt>
400543: .. .. .. .. .. .. ..
由于我不熟悉GCC的实现,我只能推测为什么要进行转换。也许这会让代码生成器的工作变得更容易,因为它只需要处理一个案例。我希望有人能想出一个更明确的答案。