尝试从 g++ 理解简单的反汇编代码



我仍在努力使用g++内联汇编器,并试图了解如何使用它。

我从这里改编了一段代码:http://asm.sourceforge.net/articles/linasm.html(引自 gcc 信息文件中的"带有 C 表达式操作数的汇编程序指令"部分)

static inline uint32_t sum0() {
   uint32_t foo = 1, bar=2;
   uint32_t ret;
   __asm__ __volatile__ (
      "add  %%ebx,%%eax" 
         : "=eax"(ret)              // ouput
         : "eax"(foo), "ebx"(bar)   // input
         : "eax"                    // modify
   );
   return ret;
}

我编译了禁用优化:

g++ -Og -O0 inline1.cpp -o test

反汇编的代码让我感到困惑:

(gdb) disassemble sum0
Dump of assembler code for function sum0():
   0x00000000000009de <+0>:   push   %rbp                  ;prologue...
   0x00000000000009df <+1>:   mov    %rsp,%rbp             ;prologue...
   0x00000000000009e2 <+4>:   movl   $0x1,-0xc(%rbp)       ;initialize foo
   0x00000000000009e9 <+11>:  movl   $0x2,-0x8(%rbp)       ;initialize bar
   0x00000000000009f0 <+18>:  mov    -0xc(%rbp),%edx       ;
   0x00000000000009f3 <+21>:  mov    -0x8(%rbp),%ecx       ;
   0x00000000000009f6 <+24>:  mov    %edx,-0x14(%rbp)      ; This is unexpected
   0x00000000000009f9 <+27>:  movd   -0x14(%rbp),%xmm1     ; why moving variables
   0x00000000000009fe <+32>:  mov    %ecx,-0x14(%rbp)      ; to extended registers?
   0x0000000000000a01 <+35>:  movd   -0x14(%rbp),%xmm2     ;
   0x0000000000000a06 <+40>:  add    %ebx,%eax             ; add (as expected)
   0x0000000000000a08 <+42>:  movd   %xmm0,%edx            ; copying the wrong result to ret
   0x0000000000000a0c <+46>:  mov    %edx,-0x4(%rbp)       ;    "     "    "     "     "  "
   0x0000000000000a0f <+49>:  mov    -0x4(%rbp),%eax       ;    "     "    "     "     "  "
   0x0000000000000a12 <+52>:  pop    %rbp                  ;
   0x0000000000000a13 <+53>:  retq   
End of assembler dump.

正如预期的那样,sum0() 函数返回错误的值。

有什么想法吗?这是怎么回事?如何做到正确?

--编辑--根据@MarcGlisse评论,我尝试了:

static inline uint32_t sum0() {
   uint32_t foo = 1, bar=2;
   uint32_t ret;
   __asm__ __volatile__ (
      "add  %%ebx,%%eax" 
         : "=a"(ret)             // ouput
         : "a"(foo), "b"(bar)     // input
         : "eax"                 // modify
   );
   return ret;
}

似乎我一直遵循的教程具有误导性。输出/输入字段中的"EAX"不是指寄存器本身,而是缩写表上的 e,a,x 缩写。

无论如何,我仍然没有做对。上面的代码导致编译错误:"asm"操作数具有不可能的约束。

我不明白为什么。

x86 的扩展内联程序集约束列在官方文档中。
完整的文档也值得一读。

如您所见,约束都是单个字母。
约束 "eax" fo foo 指定了三个约束:

一个
   A 寄存器。

x
   任何 SSE 寄存器。

e
   32 位有符号整数常量,或 ...

由于您告诉 GCC eax被破坏,因此它无法将输入操作数放在那里,它会选择xmm0

当编译器选择要用于表示输入操作数的寄存器时,它不使用任何被破坏的寄存器

适当的约束只是"a"。
您需要从碎屑中删除eax(顺便说一下,由于上位归零,它应该rax)(并添加"cc")。

最新更新