如果我写:
int some_arr[4];
some_arr = {0, 1, 2, 3};
然后我的编译器(在本例中为 GCC(会抱怨我在{
之前没有表达式。所以我需要使用复合文字,很好:
int some_arr[4];
some_arr = (int[]){0, 1, 2, 3};
现在我们看到我不允许为数组赋值。
什么?
我可以通过类似memcpy(some_arr, (int[]){0, 1, 2, 3}, sizeof(int[4]))
的东西来"规避"这一点,或者通过逐个分配给some_arr
的每个元素(或通过循环(。我无法想象GCC无法从我写的内容中解析单个赋值(一个不关心用户的懒惰编译器甚至可以在预处理器中做到这一点(,所以它似乎归结为"标准说不"。那么,为什么标准说这个特定的东西是禁区呢?
我不是在标准中寻找说它不允许的语言,而是在寻找关于标准的一部分是如何形成的历史课。
摘自ISO/IEC 9899:1999关于赋值运算符约束的规定
§6.5.16 赋值运算符应有一个可修改的左操作数作为其左操作数。
然后在可修改的左值上
§6.3.2.1 可修改的左值是没有数组类型的左值,不 没有不完整的类型,没有 const 限定的类型,并且 如果它是一个结构或工会,则没有任何成员(包括, 递归地,所有包含的聚合的任何成员或元素,或 工会(具有符合 CONST 资格的类型。
为什么不呢?可能是因为数组名称很可能衰减为指向第一个元素的指针。
但是,允许使用由结构包装的数组赋值,如下所示:
//gcc 5.4.0
#include <stdio.h>
struct A
{
int arr[3];
int b;
};
struct A foo()
{
struct A a = {{1, 2, 3},10};
return a;
}
int main(void)
{
struct A b = foo();
for (int i=0; i<3; i++)
printf("%dn",b.arr[i]);
printf("%dn", b.b);
}
收益 率
1
2
3
10
tl;博士:
因为 C 认为数组衰减到指针,并且没有为程序员提供避免它的方法。
长答案:
当你写的时候
int arr[4];
从那一刻起,每次在动态上下文中使用arr
时,C 都认为arr
是&arr[0]
的,即数组对指针的衰减(另请参阅此处和此处(。
因此:
arr = (int[]){0, 1, 2, 3};
被认为是
&arr[0] = (int[]){0, 1, 2, 3};
无法分配。编译器可以使用memcpy()
实现一个完整的数组副本,但是C必须提供一种方法来告诉编译器何时衰减到指针,何时不衰减。
请注意,动态上下文不同于静态上下文。sizeof(arr)
和&arr
是在编译时处理的静态上下文,其中arr
被视为数组。
同样,初始化
int arr[4] = {0, 1, 2, 3};
或
int arr[] = {0, 1, 2, 3};
是静态上下文 - 这些初始化发生在程序加载到内存中时,甚至在执行之前。
标准中的语言是:
除非它是 sizeof 运算符或一元运算符的操作数,或者是用于初始化数组的字符串文字,否则类型为"type"的数组的表达式将转换为类型为"指向类型的指针"的表达式,该表达式指向数组对象的初始元素,而不是左值。如果数组对象具有寄存器存储类,则行为未定义。
当数组位于结构内时,例如
struct s {
int arr[4];
};
struct s s1, s2;
再使用s1.arr
就像&s1.arr[0]
,不能分配。
但是,虽然s1 = s2
是动态上下文,但不引用数组。编译器知道它需要复制完整的数组,因为它是结构定义的一部分,并且此赋值是隐式生成的。例如,如果编译器选择使用memcpy()
实现结构赋值,则会自动复制数组。