// Compiled with GCC 7.3.0, x86-64 -g -O3 -std=gnu++11
// Tested on OS (1) Ubuntu 18.04 LTS, (2) Gentoo
int Listen(... socket)
{
char buffer[INT16_MAX];
. . .
. . . = recvfrom(socket, buffer, ....)
ParseMsg(buffer)
}
void ParseMsg(uint8_t *const msg)
{
. . .
uint16_t* word_arr = (uint16_t*)(msg+15); // if I changed 15 to 16 (aligned to uint16_t)
// the program doesn't crash
for(size_t i = 0 ; i < 30 ; ++i)
{
word_arr[i] = 1; // after some iterations (around 13) the program crashes with segmentation fault
// if i add a print statement inside the loop the program doesn't crash
}
// word_arr[20] = 1; // if I assign value not in loop the program doesn't crash
}
我发现了一些关于此事的链接:
https://github.com/samtools/htslib/issues/400
https://github.com/xianyi/OpenBLAS/issues/1137
但它们使用处理器术语。有人能确认这个bug存在吗?
p.s
我运行了带有-O2优化标志的代码。没有崩溃
问题确实在uint16_t
指针(应该是2(的对齐中出现下划线,结合-O3
,编译器试图使用矢量化(SIMD(优化循环,因此试图将未对齐的参数加载到SSE寄存器。
这可以解释为什么它在以下情况下工作:
- 将偏移量从15更改为16-导致
uint16_t
指针对齐 - 使用
-O2
-禁用矢量化 - 删除循环/在循环中添加打印-同时禁用矢量化
请参阅以下链接,其中包含与您相似的问题和一些精心设计的答案:
c-不确定的行为-限制-混淆-规则-校正-对准