所以我在使用编译单元时偶然发现了这个。
我有 2 个标题,用于定义一个同名的类。第一个编译单元包括第一个标头并声明指向类的外部指针,第二个编译单元包括第二个标头并定义指针。
现在我让 T* 指向一个 U。
麦克维:
h1.h
#pragma once
struct a_struct {
int i;
a_struct(int _i) : i{ _i } {}
};
h2.h
#pragma once
struct a_struct {
float f;
a_struct(float _f) : f{ _f } {}
};
福.H
#pragma once
struct foo {
int bar();
};
铜1.cpp
#include "foo.h"
#include "h1.h"
extern a_struct* s;
int foo::bar() {
return s->i;
}
铜2.cpp
#include "h2.h"
a_struct* s = new a_struct(1.0f);
主.cpp
#include "foo.h"
#include <iostream>
int main() {
foo f;
std::cout << f.bar() << std::endl; // <- 1065353216
system("PAUSE");
return 0;
}
为什么链接器看不到 h1.h::a_struct 不是 h2.h::a_struct ?这在标准中是否被提及为未定义的行为?
(我也知道用同名命名 2 个类是愚蠢的......
这在标准中是否被提及为未定义的行为?
是的,这违反了一个定义规则的"标头版本"。在此版本中,适用于类定义、inline
函数和变量以及头文件中通常定义的其他此类内容,允许在单独的转换单元中对单个实体进行多个定义,但这些定义必须具有相同的标记(经过预处理),并且必须基本上意味着相同的内容。以这种方式不同的多个定义是未定义的行为。见C++20草案中的[basic.def.odr]/12,以及第 cppreference.com 的"一个定义规则"下的第五段。
为什么链接器看不到 h1.h
::a_struct
不是 h2.h::a_struct
?
在大多数C++实现中,编译器将翻译单元转换为包含函数代码和符号定义的对象文件,并且函数代码可以使用其他对象定义的附加"未定义符号"。在对象文件时,除了可能在调试器数据中之外,很少保存有关C++源或类型信息的信息。链接器可能会只看到 cu1.o 中foo::bar()
使用未定义的符号s
,cu2.o 定义符号s
,而 cu2.o 的全局动态初始化函数也使用符号s
。链接器只会调整内容,以便执行foo::bar()
将正确访问相同的对象s
,而不太关心任何函数实际上如何处理属于该符号的字节。
(当对象文件不同意与符号关联的字节数时,链接器有时会发出警告,但两个指向类类型的指针类型的对象可能具有相同的大小。
编译器分别编译每个源文件。它信任给定的类声明对于所有源文件都是相同的。
当您执行上述操作时,您会诱骗编译器编译两个具有某些类的两个不同定义的文件。每个文件都会生成一段自洽的代码。
然后链接器进来并将您的各种代码链接在一起。有一种对象/库格式在所有编译器之间共享。这是为了允许每个链接器与每个编译器一起工作。此时,链接器只知道一些代码将传递一个foo对象,而其他一些代码将接收一个foo对象。去偷看、检查和抱怨不是它的事。
请记住,在链接时,源代码甚至可能不可用。您可能拥有来自某些供应商的库,但没有源代码。并且可能有多种 #defines 可能会影响此对象。链接器不需要知道编译设置是什么,甚至不需要知道源是什么。代码甚至可以用另一种语言编写。
为了获得这种灵活性和互操作性,您必须遵守一些规则。其中之一是"不要以不同的方式两次定义同一个类"。