我有一个结构体数组,我有一些函数将使用这些结构体的几个成员。我想避免每一行的引用。我认为会有一些方法来声明一个变量在特定的内存位置…比如:
someStruct &myStruct = arrayOfStructs[i];
myStruct.x = foo+bar*myStruct.y*myStruct.w;
//Instead of myStruct->x = foo+bar*myStruct->y*myStruct->w;
//It would/should even be possible to access the members in a similar way:
int &x = &myStruct.x;
x = x+4*y+2*z;
//This should avoid overhead of dereferencing the pointer, and offsetting to the member
//by just accessing that particular address of memory as though it was where the variable
//had always been.
这段示例代码可以帮助解释:
#define NUM_BIGSTRUCTS 10000
typedef struct {
int a,b,c;
float d,e,f;
} bigStruct;
bigStruct* arrayOfStructs;
void foo() {
for(int i=0; i<NUM_BIGSTRUCTS; i++) {
bigStruct* temp = arrayOfStructs[i];
temp->f = (temp->d+temp->e)*((float)temp->a+temp->e);
//more similar, with conditionals, etc...
//actually I've got nested loops, and a very very large array
//so any gains per inner loop would decrease my number of instructions exponentially
//So, if I could declare a bigStruct and set its address to the location of a bigStruct in the array
//then I could avoid a dereference every time I access a member of that bigStruct
//Leaving just the member access overhead... which could be handled in a similar manner
//if possible, and when appropriate
}
}
int main(int argx, char** argv) {
arrayOfStructs = g_new0(bigStruct,NUM_BIGSTRUCTS); //Allocate and 0 memory for simplicity
foo();
return 0;
}
我从来没有在SO上取得过巨大的成功,所以希望我解释了我想做的事情。顺便说一句,我使用的是C99,我相信考虑到c的低级特性,这是可能的。
[编辑]看起来我正在寻找来自c++的"引用",但对于C.即使如此,它们只允许赋值一次(初始化),这在我的例子中不起作用。我决定依靠编译器来优化对同一内存部分的多次访问。
谢谢,詹姆斯·纽曼
你正在尝试一些编译器优化做得比你手动做得更好的事情。此外,C99没有您在示例中试图定义它们的方式(特别是c++解引用声明)的这些引用构造,如果您也变得非常庞大和深入,我建议您重新考虑您的算法。如果你试图引入一些临时变量和更多的内存来做引用,你会让你的生活变得更加困难。
例如,如果你看:
struct some_struct {
int a;
struct {
float f;
double d;
} s;
};
struct some_struct array[10000];
int process1(struct some_struct *r) {
#define R (*r)
R.a+= 1;
R.s.f = R.s.f/2;
R.s.d = ( R.s.d + R.s.f ) * 2;
}
int process2(struct some_struct *r) {
r->a+= 1;
r->s.f = r->s.f/2;
r->s.d = ( r->s.d + r->s.f ) * 2;
}
int doit() {
int i;
for (i = 0; i < sizeof(array)/sizeof(struct some_struct); i++ ) {
struct some_struct *r = &array[i]; /* via reference */
process1(r);
process2(r);
}
}
process1和process2在x86_64平台上使用gcc -O2生成相同的汇编输出:
.file "foo.c"
.text
.p2align 4,,15
.globl process1
.type process1, @function
process1:
.LFB11:
.cfi_startproc
movss .LC0(%rip), %xmm0
addl $1, (%rdi)
mulss 8(%rdi), %xmm0
movss %xmm0, 8(%rdi)
unpcklps %xmm0, %xmm0
cvtps2pd %xmm0, %xmm0
addsd 16(%rdi), %xmm0
addsd %xmm0, %xmm0
movsd %xmm0, 16(%rdi)
ret
.cfi_endproc
.LFE11:
.size process1, .-process1
.p2align 4,,15
.globl process2
.type process2, @function
process2:
.LFB12:
.cfi_startproc
movss .LC0(%rip), %xmm0
addl $1, (%rdi)
mulss 8(%rdi), %xmm0
movss %xmm0, 8(%rdi)
unpcklps %xmm0, %xmm0
cvtps2pd %xmm0, %xmm0
addsd 16(%rdi), %xmm0
addsd %xmm0, %xmm0
movsd %xmm0, 16(%rdi)
ret
.cfi_endproc
.LFE12:
.size process2, .-process2
.p2align 4,,15
.globl doit
.type doit, @function
doit:
.LFB13:
.cfi_startproc
xorl %edx, %edx
movss .LC0(%rip), %xmm2
.p2align 4,,10
.p2align 3
.L4:
leaq (%rdx,%rdx,2), %rax
addq $1, %rdx
leaq array(,%rax,8), %rax
movss 8(%rax), %xmm1
addl $2, (%rax)
mulss %xmm2, %xmm1
cmpq $10000, %rdx
unpcklps %xmm1, %xmm1
cvtps2pd %xmm1, %xmm0
mulss %xmm2, %xmm1
addsd 16(%rax), %xmm0
movss %xmm1, 8(%rax)
unpcklps %xmm1, %xmm1
cvtps2pd %xmm1, %xmm1
addsd %xmm0, %xmm0
addsd %xmm1, %xmm0
addsd %xmm0, %xmm0
movsd %xmm0, 16(%rax)
jne .L4
rep
ret
.cfi_endproc
.LFE13:
.size doit, .-doit
.comm array,240000,32
.section .rodata.cst4,"aM",@progbits,4
.align 4
.LC0:
.long 1056964608
.ident "GCC: (GNU) 4.6.1"
.section .note.GNU-stack,"",@progbits
但是…没有什么开销可谈!
你所做的实际上是增加了开销。
我认为你需要知道你不应该反对一门语言,而应该使用它;否则,它就像你试图用锤子把一个方钉子穿过一个圆孔。
你的主意帮不了你什么。指针允许您使用非局部内存。根据定义,数组中的结构体在很远的地方,而不能在很远的地方声明局部变量——这将是矛盾的。
当你说到int &x = &myStruct.x;
时,你混淆了两个概念:
-
本地变量:您可以很容易地
int x = temp->x //work with x... temp->x = x
的好处是,当你用它工作时,你是在用离你很近的东西。缺点是来回复制,但确实可能有一些东西。
-
指针:另一种方法是
int *x = &temp->x //work with x, like you would a pointer
但是,这真的没有太大的帮助,因为这与到处使用
temp->x
没有太大的不同。(可能除了清晰度)。考虑一下数组:假设您有以下代码:int array[25]; array[3] = array[2] + array[3]; array[7] = array[3]*array[7] + array[3]<<7;
你建议把它变成这样:
int array[25] int *a = &array[3], *b=&array[2], *c=&array[7]; *a = *b+*a; *c = (*a)*(*c) + *a<<7;
它可能更具可读性,但生成的代码可能相似,重要的是,您对远端内存的干扰次数与完全相同。
我想你在找位置新操作符,但那是c++,不是C。
除此之外,我同意其他人的意见——别管它。