我在Cortex-R4中运行的C代码中进行优化。首先,当我在条件检查中指示"__builtin_expect"时,我没有看到汇编代码输出有任何变化。似乎编译器生成了不必要的 Jump。
我的 C 代码:
bit ++; (Likely)
if(__builtin_expect(bit >= 32),0)
{
bit -=32; // unlikely code
xxxxxx; // unlikely code
xxxxxx; // unlikely code
xxxxxx; // unlikely code
}
bit = bit*2 // something (Likely)
return bit;
---- 生成的 ASM 代码--------(位 => R0(
ADD r2,r2,#1
CMP r0,#0x20
BCC NoDecrement
SUB r0,r0,#0x20
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX
NoDecrement LSL r0,r0,#1
BX lr
---- 我预期的 ASM 代码--------
ADD r2,r2,#1
CMP r0,#0x20
BHE Decrement
JumbBack LSL r0,r0,#1
BX lr
Decrement SUB r0,r0,#0x20
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX
B JumbBack
假设如果这段 C 代码在循环中运行,那么每次它都必须跳转(因为 if 条件只传递一次(。是否有任何其他编译器设置实际上会按预期生成代码..??
你写道:
if(__builtin_expect(bit >= 32),0)
{
...
}
大括号内的代码永远不会被执行,因为它被if(foo,0)
包围,这相当于if(0)
任何值foo
,无论你尝试使用什么内置。如果使用 -O2
打开优化,您将看到编译器完全删除了死代码,而不仅仅是跳过它。我想你可能想写
if (__builtin_expect(bit >= 32, 0)) {
bit -= 32;
}
如果我这样做,我会得到我期望的正向分支(clang -O1
或更高(。
extern void something();
int foo(int bit)
{
++bit;
if (__builtin_expect(bit >= 32, 0)) {
bit -= 32; // "Decrement"
something();
}
bit = bit*2;
something();
return bit;
}
这是来自clang -arch armv7 -O2 -S
的代码:
_foo:
@ BB#0:
push {r4, r7, lr}
adds r4, r0, #1
add r7, sp, #4
cmp r4, #32
bge LBB0_2 // a forward branch for the unlikely case
LBB0_1:
lsls r4, r4, #1
blx _something
mov r0, r4
pop {r4, r7, pc}
LBB0_2: // "Decrement"
sub.w r4, r0, #31
blx _something
b LBB0_1