为什么在 C 中不允许分配给数组?



如果我写:

int some_arr[4];
some_arr = {0, 1, 2, 3};

然后我的编译器(在本例中为 GCC(会抱怨我在{之前没有表达式。所以我需要使用复合文字,很好:

int some_arr[4];
some_arr = (int[]){0, 1, 2, 3};

现在我们看到我不允许为数组赋值。

什么?

我可以通过类似memcpy(some_arr, (int[]){0, 1, 2, 3}, sizeof(int[4]))的东西来"规避"这一点,或者通过逐个分配给some_arr的每个元素(或通过循环(。我无法想象GCC无法从我写的内容中解析单个赋值(一个不关心用户的懒惰编译器甚至可以在预处理器中做到这一点(,所以它似乎归结为"标准说不"。那么,为什么标准这个特定的东西是禁区呢?

我不是在标准中寻找说它不允许的语言,而是在寻找关于标准的一部分是如何形成的历史课。

摘自ISO/IEC 9899:1999关于赋值运算符约束的规定

§6.5.16 赋值运算符应有一个可修改的左操作数作为其左操作数。

然后在可修改的左值上

§6.3.2.1 可修改的左值是没有数组类型的左值,不 没有不完整的类型,没有 const 限定的类型,并且 如果它是一个结构或工会,则没有任何成员(包括, 递归地,所有包含的聚合的任何成员或元素,或 工会(具有符合 CONST 资格的类型。

为什么不呢?可能是因为数组名称很可能衰减为指向第一个元素的指针。


但是,允许使用由结构包装的数组赋值,如下所示:

//gcc 5.4.0
#include  <stdio.h>
struct A
{
int arr[3];
int b;
};
struct A foo()
{
struct A a = {{1, 2, 3},10};
return a;
}
int main(void)
{
struct A b = foo();
for (int i=0; i<3; i++)
printf("%dn",b.arr[i]);
printf("%dn", b.b);
}

收益 率

1
2
3
10

tl;博士

因为 C 认为数组衰减到指针,并且没有为程序员提供避免它的方法。

长答案

当你写的时候

int arr[4];

从那一刻起,每次在动态上下文中使用arr时,C 都认为arr&arr[0]的,即数组对指针的衰减(另请参阅此处和此处(。

因此:

arr = (int[]){0, 1, 2, 3};

被认为是

&arr[0] = (int[]){0, 1, 2, 3};

无法分配。编译器可以使用memcpy()实现一个完整的数组副本,但是C必须提供一种方法来告诉编译器何时衰减到指针,何时不衰减。

请注意,动态上下文不同于静态上下文。sizeof(arr)&arr是在编译时处理的静态上下文,其中arr被视为数组。

同样,初始化

int arr[4] = {0, 1, 2, 3};

int arr[] = {0, 1, 2, 3};

是静态上下文 - 这些初始化发生在程序加载到内存中时,甚至在执行之前。

标准中的语言是:

除非它是 sizeof 运算符或一元运算符的操作数,或者是用于初始化数组的字符串文字,否则类型为"type"的数组的表达式将转换为类型为"指向类型的指针"的表达式,该表达式指向数组对象的初始元素,而不是左值。如果数组对象具有寄存器存储类,则行为未定义。

当数组位于结构内时,例如

struct s {
int arr[4];
};
struct s s1, s2;

再使用s1.arr就像&s1.arr[0],不能分配。

但是,虽然s1 = s2是动态上下文,但不引用数组。编译器知道它需要复制完整的数组,因为它是结构定义的一部分,并且此赋值是隐式生成的。例如,如果编译器选择使用memcpy()实现结构赋值,则会自动复制数组。

最新更新