如何在 32 位体系结构的最低级别实现 64 位类型和操作?

  • 本文关键字:实现 类型 操作 体系结构 c++
  • 更新时间 :
  • 英文 :


像int64_t这样的类型是如何在最低的(即汇编级别)实现的?例如,我使用的是 32 位机器,仍然可以使用 int64_t。我最初的假设是 64 位只是模拟的,因此与在 32 位机器上的 32 位数据类型相比,使用这些类型的计算必须有相当大的开销。

提前感谢您和问候

你是对的,当你编译 32 位体系结构的代码时,你必须使用 32 位操作数模拟 64 位操作数和操作。

一个8字节的变量(uint64_t只是long long的typedef)存储在2个4字节寄存器中。

对于加法(和减法),您必须首先添加较低的 4 个字节,然后在较高的 4 个字节上执行第二次加法(或借用减法)。由于第二个添加也添加了第一个添加的进位,因此结果是正确的。加减的开销不大。

然而,对于乘法和除法,事情并没有那么简单。通常调用例程来执行此类操作,并且开销要大得多。


让我们以这个简单的 c 代码为例:

int main() {
long long a = 0x0102030405060708;
long long b = 0xA1A2A3A4A5A6A7A8;
long long c = 0xB1B2B3B4B5B6B7B8;
c = a + b;
c = a - b;
c = a * b;
c = a / b;
return 0;
}

分析MSVC生成的程序集,我们可以看到:


2:   long long a = 0x0102030405060708;
012D13DE  mov         dword ptr [a],5060708h  
012D13E5  mov         dword ptr [ebp-8],1020304h  
3:   long long b = 0xA1A2A3A4A5A6A7A8;
012D13EC  mov         dword ptr [b],0A5A6A7A8h  
012D13F3  mov         dword ptr [ebp-18h],0A1A2A3A4h  
4:   long long c = 0xB1B2B3B4B5B6B7B8;
012D13FA  mov         dword ptr [c],0B5B6B7B8h  
012D1401  mov         dword ptr [ebp-28h],0B1B2B3B4h  

64 位变量分为 2 个 32 位位置。


6:   c = a + b;
012D1408  mov         eax,dword ptr [a]  
012D140B  add         eax,dword ptr [b]  
012D140E  mov         ecx,dword ptr [ebp-8]  
012D1411  adc         ecx,dword ptr [ebp-18h]  
012D1414  mov         dword ptr [c],eax  
012D1417  mov         dword ptr [ebp-28h],ecx  
7:   c = a - b;
012D141A  mov         eax,dword ptr [a]  
012D141D  sub         eax,dword ptr [b]  
012D1420  mov         ecx,dword ptr [ebp-8]  
012D1423  sbb         ecx,dword ptr [ebp-18h]  
012D1426  mov         dword ptr [c],eax  
012D1429  mov         dword ptr [ebp-28h],ecx  

对较低的 32 位使用add指令执行求和,然后对较高的 32 位使用adc(加进位)执行总和。减法类似:第二个运算是sbb(借用减法)。


8:   c = a * b;
012D142C  mov         eax,dword ptr [ebp-18h]  
012D142F  push        eax  
012D1430  mov         ecx,dword ptr [b]  
012D1433  push        ecx  
012D1434  mov         edx,dword ptr [ebp-8]  
012D1437  push        edx  
012D1438  mov         eax,dword ptr [a]  
012D143B  push        eax  
012D143C  call        __allmul (012D105Ah)  
012D1441  mov         dword ptr [c],eax  
012D1444  mov         dword ptr [ebp-28h],edx  
9:   c = a / b;
012D1447  mov         eax,dword ptr [ebp-18h]  
012D144A  push        eax  
012D144B  mov         ecx,dword ptr [b]  
012D144E  push        ecx  
012D144F  mov         edx,dword ptr [ebp-8]  
012D1452  push        edx  
012D1453  mov         eax,dword ptr [a]  
012D1456  push        eax  
012D1457  call        __alldiv (012D1078h)  
012D145C  mov         dword ptr [c],eax  
012D145F  mov         dword ptr [ebp-28h],edx  

产品和除法是通过调用特殊例程来执行的。

最新更新