以下内容在MSVC上编译时没有警告。
#include <iostream>
#include <emmintrin.h>
int main()
{
__declspec(align(16)) int x = 42;
std::cout << &x << "n"; // Print out the address that holds x
__m128i v = _mm_load_si128((__m128i const*)(x));
}
实质上,代码对齐 32 位整数,并尝试将其加载到 __m128i 类型中。_mm_load_si128
要求输入地址以 16 字节对齐。_mm_loadu_si128
不需要它,但两者都会导致上述代码在运行时发出访问冲突。为什么,我该如何解决它?
你忘了取x
的地址:
__m128i v = _mm_load_si128((__m128i const*)(&x));
// ^
// |
// Here ----------------+
此外,您没有为数据提供足够的空间,因此_mm_load_si128
最终会读取超过分配的内存块的末尾。