我试图通过调用printf
来打印一个浮点数,但它似乎总是只是打印pi值(3.1415),尽管结果应该是圆的面积,应该在计算后移动到pi变量。
.section .data
value:
.quad 0
result:
.asciz "The result is %lf n"
pi:
.double 3.14159
.section .bss
.section .text
.globl _start
.type area, @function
area:
nop
imulq %rbx, %rbx
movq %rbx, value
fildq value
fmul pi # multiply r^2 by pi
fst pi # Store result to pi
movupd pi, %xmm0 # move result to xmm0
nop
ret
_start:
nop
movq $2, %rbx
call area # calculate for radius 2
leaq result, %rdi
movq $1, %rax # specify only one float value
call printf
movq $0, %rdi # Exit
call exit
nop
我总是得到3.1415回来。我不知道为什么,因为它应该被fst
指令覆盖。
如果浮点操作恰好使用内存操作数,则需要为其添加大小后缀。否则,GNU汇编程序将隐式地使用单精度,这不是您想要的。要修改代码,请修改
fmul pi # multiply r^2 by pi
fst pi # Store result to pi
fmull pi # multiply r^2 by pi
fstl pi # Store result to pi
关于你的代码的一些其他注释:
尽可能使用
rip
-相对寻址模式而不是绝对寻址模式。具体来说,这意味着在内存操作数中用foo(%rip)
替换foo
,包括lea result(%rip), %rdi
确保在函数末尾留下一个干净的x87堆栈,否则其他代码可能会导致它溢出。例如,使用
fstpl pi(%rip)
来存储结果并将其从堆栈中弹出。使用
movsd
而不是movupd
将一个双精度体加载到SSE寄存器中,而不是一对。考虑使用SSE而不是x87,如果可能的话所有数学。这是在x86-64中执行标量FP数学的标准方法,这就是为什么XMM寄存器是调用约定的一部分。(除非你需要80位扩展精度,但你在内存中有一个
pi
常数,其精度远低于x87fldpi
。)... cvtsi2sd %rbx, %xmm0 mulsd pi(%rip), %xmm0 ret