我怎样才能避免多次解引用同一个变量?



我有一个结构体数组,我有一些函数将使用这些结构体的几个成员。我想避免每一行的引用。我认为会有一些方法来声明一个变量在特定的内存位置…比如:

someStruct &myStruct = arrayOfStructs[i];
myStruct.x = foo+bar*myStruct.y*myStruct.w;
//Instead of myStruct->x = foo+bar*myStruct->y*myStruct->w;
//It would/should even be possible to access the members in a similar way:
int &x = &myStruct.x;
x = x+4*y+2*z;
//This should avoid overhead of dereferencing the pointer, and offsetting to the member
//by just accessing that particular address of memory as though it was where the variable
//had always been.

这段示例代码可以帮助解释:

#define NUM_BIGSTRUCTS 10000
typedef struct {
  int a,b,c;
  float d,e,f;
} bigStruct;
bigStruct* arrayOfStructs;
void foo() {
  for(int i=0; i<NUM_BIGSTRUCTS; i++) {
    bigStruct* temp = arrayOfStructs[i];
    temp->f = (temp->d+temp->e)*((float)temp->a+temp->e);
    //more similar, with conditionals, etc...
    //actually I've got nested loops, and a very very large array
    //so any gains per inner loop would decrease my number of instructions exponentially
    //So, if I could declare a bigStruct and set its address to the location of a bigStruct in the array
    //then I could avoid a dereference every time I access a member of that bigStruct
    //Leaving just the member access overhead... which could be handled in a similar manner
    //if possible, and when appropriate
  }
}
int main(int argx, char** argv) {
  arrayOfStructs = g_new0(bigStruct,NUM_BIGSTRUCTS); //Allocate and 0 memory for simplicity
  foo();
  return 0;
}

我从来没有在SO上取得过巨大的成功,所以希望我解释了我想做的事情。顺便说一句,我使用的是C99,我相信考虑到c的低级特性,这是可能的。

[编辑]看起来我正在寻找来自c++的"引用",但对于C.即使如此,它们只允许赋值一次(初始化),这在我的例子中不起作用。我决定依靠编译器来优化对同一内存部分的多次访问。

谢谢,詹姆斯·纽曼

你正在尝试一些编译器优化做得比你手动做得更好的事情。此外,C99没有您在示例中试图定义它们的方式(特别是c++解引用声明)的这些引用构造,如果您也变得非常庞大和深入,我建议您重新考虑您的算法。如果你试图引入一些临时变量和更多的内存来做引用,你会让你的生活变得更加困难。

例如,如果你看:

struct some_struct {
        int a;
        struct {
                float f;
                double d;
        } s;
};
struct some_struct array[10000];
int process1(struct some_struct *r) {
#define R (*r)
        R.a+= 1;
        R.s.f = R.s.f/2;
        R.s.d = ( R.s.d + R.s.f ) * 2;
}
int process2(struct some_struct *r) {
        r->a+= 1;
        r->s.f = r->s.f/2;
        r->s.d = ( r->s.d + r->s.f ) * 2;
}
int doit() {
        int i;
        for (i = 0; i < sizeof(array)/sizeof(struct some_struct); i++ ) {
                struct some_struct *r = &array[i]; /* via reference */
                process1(r);
                process2(r);
        }
}

process1和process2在x86_64平台上使用gcc -O2生成相同的汇编输出:

        .file   "foo.c"
        .text
        .p2align 4,,15
        .globl  process1
        .type   process1, @function
process1:
.LFB11:
        .cfi_startproc
        movss   .LC0(%rip), %xmm0
        addl    $1, (%rdi)
        mulss   8(%rdi), %xmm0
        movss   %xmm0, 8(%rdi)
        unpcklps        %xmm0, %xmm0
        cvtps2pd        %xmm0, %xmm0
        addsd   16(%rdi), %xmm0
        addsd   %xmm0, %xmm0
        movsd   %xmm0, 16(%rdi)
        ret
        .cfi_endproc
.LFE11:
        .size   process1, .-process1
        .p2align 4,,15
        .globl  process2
        .type   process2, @function
process2:
.LFB12:
        .cfi_startproc
        movss   .LC0(%rip), %xmm0
        addl    $1, (%rdi)
        mulss   8(%rdi), %xmm0
        movss   %xmm0, 8(%rdi)
        unpcklps        %xmm0, %xmm0
        cvtps2pd        %xmm0, %xmm0
        addsd   16(%rdi), %xmm0
        addsd   %xmm0, %xmm0
        movsd   %xmm0, 16(%rdi)
        ret
        .cfi_endproc
.LFE12:
        .size   process2, .-process2
        .p2align 4,,15
        .globl  doit
        .type   doit, @function
doit:
.LFB13:
        .cfi_startproc
        xorl    %edx, %edx
        movss   .LC0(%rip), %xmm2
        .p2align 4,,10
        .p2align 3
.L4:
        leaq    (%rdx,%rdx,2), %rax
        addq    $1, %rdx
        leaq    array(,%rax,8), %rax
        movss   8(%rax), %xmm1
        addl    $2, (%rax)
        mulss   %xmm2, %xmm1
        cmpq    $10000, %rdx
        unpcklps        %xmm1, %xmm1
        cvtps2pd        %xmm1, %xmm0
        mulss   %xmm2, %xmm1
        addsd   16(%rax), %xmm0
        movss   %xmm1, 8(%rax)
        unpcklps        %xmm1, %xmm1
        cvtps2pd        %xmm1, %xmm1
        addsd   %xmm0, %xmm0
        addsd   %xmm1, %xmm0
        addsd   %xmm0, %xmm0
        movsd   %xmm0, 16(%rax)
        jne     .L4
        rep
        ret
        .cfi_endproc
.LFE13:
        .size   doit, .-doit
        .comm   array,240000,32
        .section        .rodata.cst4,"aM",@progbits,4
        .align 4
.LC0:
        .long   1056964608
        .ident  "GCC: (GNU) 4.6.1"
        .section        .note.GNU-stack,"",@progbits

但是…没有什么开销可谈!

你所做的实际上是增加了开销。

我认为你需要知道你不应该反对一门语言,而应该使用它;否则,它就像你试图用锤子把一个方钉子穿过一个圆孔。

你的主意帮不了你什么。指针允许您使用非局部内存。根据定义,数组中的结构体在很远的地方,而不能在很远的地方声明局部变量——这将是矛盾的。

当你说到int &x = &myStruct.x;时,你混淆了两个概念:

  • 本地变量:您可以很容易地

        int x = temp->x
        //work with x...
        temp->x = x
    

    的好处是,当你用它工作时,你是在用离你很近的东西。缺点是来回复制,但确实可能有一些东西。

  • 指针:另一种方法是

       int *x = &temp->x
       //work with x, like you would a pointer
    

    但是,这真的没有太大的帮助,因为这与到处使用temp->x没有太大的不同。(可能除了清晰度)。考虑一下数组:假设您有以下代码:

      int array[25];
      array[3] = array[2] + array[3];
      array[7] = array[3]*array[7] + array[3]<<7;
    

    你建议把它变成这样:

     int array[25]
     int *a = &array[3], *b=&array[2], *c=&array[7];
     *a = *b+*a;
     *c = (*a)*(*c) + *a<<7;
    

    它可能更具可读性,但生成的代码可能相似,重要的是,您对远端内存的干扰次数与完全相同。

我想你在找位置新操作符,但那是c++,不是C。

除此之外,我同意其他人的意见——别管它。

相关内容

  • 没有找到相关文章

最新更新