uint64 数组到 uint128 用于 SSE2



在 asm 中定义数组时以及从 c++ 传递到 asm 时,我有两个类似的问题。代码内联工作正常,但我需要将它们与 cpp 分离到一个 asm 文件中。编译器可能不会引发错误或警告,但每次运行的最终结果都是随机的,并且应该像内联时一样恒定。

下面的代码在MMX(movq mm6,twosMask_W)中使用时有效,但我需要SSE2的等效代码。我以为这会起作用,但我似乎不正确。

.data
align 16
twosMask_W qword 2 dup(0002000200020002h)
.code
...
movdqa xmm6,oword ptr twosMask_W
...

第二个问题是当我将thresh128数组从 C++ 传递到 asm 时(同样对于 SSE2):

//C++
uint64_t thresh128[2];
thresh128[0] = ((thresh-1)<<8)+(thresh-1);
thresh128[0] += (thresh128[0]<<48)+(thresh128[0]<<32)+(thresh128[0]<<16);
thresh128[1] = thresh128[0];
sendToASM(thresh128)
//ASM
;There are more parameters that utilize the registers but not listed.
receivedFromCPP proc thresh:qword
public receivedFromCPP
...
movdqu xmm4,oword ptr thresh
...

我尝试在过程中将 thresh 作为 oword 参数,但它没有产生任何结果。我确定我的语法或参数类型错误。任何帮助将不胜感激。

注意:在VS2013中为x86使用MASM编译。

好吧,我测试了第一部分,它似乎有效 - 所以我不能说任何与此特定问题相关的内容。

关于第二个问题:您似乎以 64 位模式在堆栈上传递了一个 32 位 qword(其中 64 位推送没有直接操作码),所以它将是 2 个推送......

receivedFromCPP proc thresh:qword

但期望指向堆栈上的 128 位值的指针:

movdqu xmm4,oword ptr thresh

还要记住 x86 的小端序 - 根据编译器选择如何推送 2*64 位数组,它可能与导致看似随机值的小端值不同。

编辑:由于堆栈是颠倒增长的,因此必须以相反的顺序推送128位值才能由EBP引用它。

最新更新