c中的多维数组排序导致分段故障



我试图在c中使用qsort()对二维双精度数组进行排序。数组包含3D点数据,这是使用fscanf从文件中读取的。我的编程技能相当有限,但我有非常大的数据集需要处理。如果我的代码很糟糕,请提前道歉。

23127.947, 23127.947, 23127.947
523127.790, 523127.790, 523127.790
523127.747, 523127.747, 523127.747
523127.761, 523127.761, 523127.761
523127.768, 523127.768, 523127.768
(…为3,158,632点)

我使用printf来隔离代码中的问题似乎是qsort()行,这会导致分段错误。从我读到的关于堆栈溢出的其他问题来看,这可能是我的"比较"函数的问题。制作1D数组的例子似乎很简单,但我看到的2D数组的例子并没有涉及到比较其他维度(首先是X,然后如果X1 = X2,比较Y,然后如果Y1 = Y2,比较Z)。

    int main(int argc, char *argv[]) {
    int i,j,c;
    double x,y,z;
    int ROWS = 3158632;
    int COLS = 3;
    char buffer[100];
    double** data = Make2DDoubleArray(ROWS, COLS);
    //Open the plot file to read in, and have an output write file
    FILE *fp = fopen("Plot_1-2.txt","r");
    if(fp == NULL) {
        printf("Can't open filen");
        exit;
    }
    fgets(buffer, 100, fp); //Ignore header
    for(i=0; ; i++){
        if ((c = fgetc(fp)) == EOF){
            break;
        }
        fscanf(fp,"%lf, %lf, %lf",&x, &y, &z);
        data[i][0] = x;
        data[i][1] = y;
        data[i][2] = z;
    }
    printf("First 5 unsorted numbers:n");
    for(j=0;j<5;j++){
        printf("Line %d: %.3lf, %.3lf, %.3lfn",j, data[j][0], data[j][0], data[j][0]);
    }
    printf("Last 5 unsorted numbers:n");
    for(j=ROWS-5;j<ROWS;j++){
        printf("Line %d: %.3lf, %.3lf, %.3lfn",j, data[j][0], data[j][0], data[j][0]);
    }
    /* Sort array using Quicksort algorithm: */
    printf("Sorting...n");
    qsort(data, ROWS, COLS*sizeof(double), &compare);
    printf("First 10 sorted numbers:n");
    for(j=0;j<10;j++){
        printf("Line %d: %.3lf, %.3lf, %.3lfn",j, data[j][0], data[j][0], data[j][0]);
    }
    fclose(fp);
    for (i=0; i<ROWS; i++){
        free(data[i]);
    }
    free(data);
    return 0;
}
double** Make2DDoubleArray(int arraySizeX, int arraySizeY) {  
    double** theArray; 
    int i; 
    theArray = (double**) malloc(arraySizeX*sizeof(double*));  
    for (i = 0; i < arraySizeX; i++)  
        theArray[i] = (double*) malloc(arraySizeY*sizeof(double));  
    return theArray;  
}
int compare(const void *arg1, const void *arg2) {
    //double a, b, c, d, e, f;
    double *a = (double*)arg1;
    double *b = (double*)arg2;
    double *c = ((double*)arg1 + 1);
    double *d = ((double*)arg2 + 1);
    double *e = ((double*)arg1 + 2);
    double *f = ((double*)arg2 + 2);
    if(a > b)
        return 1;
    else if(a < b)
        return -1;
    else {
        if(c > d)
            return 1;
        else if(c < d)
            return -1;
        else {
            if(e > f)
                return 1;
            else if(e < f)
                return -1;
            else
                return 0;
        }
    }
}

我想知道如果告诉qsort去"COLS * sizeof(double)"是错误的方式来做我如何分配内存的2D数组?把这个问题当作一个1D数组来处理,会使其余的工作吗?如果可能的话,我更喜欢将其保持为2D数组。

qsort期望排序的元素出现在一个连续的内存块中。如果您的所有单元格构成一个连续的内存块,可以将其解释为1D数组并与qsort一起使用,那么您仍然可以将数据保存在2D数组中。

而不是为每一行单独分配内存,就像你在Make2DDoubleArray中做的那样,一次为所有行分配内存。然后,除了你现在返回的:一个指向行指针的数组;您还必须返回(使用逐指针参数)包含所有行的内存块。

您正在为每一行分配内存

for (i = 0; i < arraySizeX; i++)  
    theArray[i] = (double*) malloc(arraySizeY*sizeof(double));

而你可以在一个步骤中分配内存

 double *cells = malloc(sizeof(double) * arraySizeX * arraySizeY);
 if (cells == NULL) { ... }
 for (i = 0; i < arraySizeX; i++)
     theArray[i] = &cells[arraySizeY * i];

然后你将有两个数组:一个指向行指针的数组,你现在有(在你的代码中称为theArray);和一个新的1D数组,保留所有行(不是指针行,而是单元格数组)(,实际上,所有单元格,其中每一行,一个三元组,是一个数据点),可用于qsort(在我的代码中称为cells)。

然后,将后一个cells(而不是data)传递给qsort

    qsort(cells, ROWS * COLS, sizeof(double), &compare);

还需要注意的是,代码中的调用问题

    qsort(data, ROWS, COLS*sizeof(double), &compare);

是错误的,因为您没有对ROWS行进行排序,每个行的大小为COLS*sizeof(double)

编辑:呃,我很抱歉。我误解了您有一个2D数组的条目,但现在我看到COLS表示一个单元格的字段。在这种情况下,你最好使用@SpacedMonkey的解决方案。只是作为参考,我的答案也会工作,然后你会调用qsort就像你做的,但在单元格
    qsort(cells, ROWS, COLS*sizeof(double), &compare);

如果没有<stdio.h>, <stdlib.h>等标头,这些都没有意义。

请解释exit;。我想你指的是exit(0);

你的main有一些问题。由于fgetc,您的代码可能会丢失第一个值的最高有效数字,这是一个微妙的错误。如果要测试EOF,测试scanf (Jee!)的返回值。我没想到这一点!我希望他们把这些东西写在手册里!他们确实…)。文件末尾的示例比这个更好,因为该示例确保fscanf实际解析了三个值。

for(size_t i=0; fscanf(fp,"%lf, %lf, %lf",&x, &y, &z) != EOF; i++){
    data[i][0] = x;
    data[i][1] = y;
    data[i][2] = z;
}

你的Make2DDoubleArray函数有问题。它分配许多不相交的数组,qsort无法处理。在一步中分配数组不是更简洁吗?

void *Make2DDoubleArray(size_t x) {  
    double (*theArray)[3] = malloc(x * sizeof *theArray);
    return theArray;
}

theArray被声明为指向3个双精度数组的指针。你甚至不需要Make2DDoubleArray

compare函数有问题。

double *a = (double*)arg1;
double *b = (double*)arg2;

ab是指针,

if(a > b)
    return 1;
else if(a < b)
    return -1;

…然而,您的代码将它们作为整数进行比较,从而导致排序出现故障。array[0]的地址总是小于array[1]的地址。


#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>
int main(int argc, char *argv[]) {
    int j,c;
    double x,y,z;
    size_t ROWS = 3158632;
    size_t COLS = 3;
    char buffer[100];
    double (*theArray)[COLS] = malloc(ROWS * sizeof *theArray);
    //Open the plot file to read in, and have an output write file
    FILE *fp = fopen("Plot_1-2.txt","r");
    if(fp == NULL) {
        printf("Can't open filen");
        exit(0);
    }
    fgets(buffer, 100, fp); //Ignore header
    for(size_t i=0; fscanf(fp,"%lf, %lf, %lf", &x, &y, &z) == 3; i++){
        data[i][0] = x;
        data[i][1] = y;
        data[i][2] = z;
    }
    printf("First 5 unsorted numbers:n");
    for(size_t j=0; j<5; j++){
        printf("Line %zu: %.3lf, %.3lf, %.3lfn", j, data[j][0], data[j][0], data[j][0]);
    }
    puts("Last 5 unsorted numbers:");
    for(size_t j=ROWS-5; j<ROWS; j++){
        printf("Line %zu: %.3lf, %.3lf, %.3lfn", j, data[j][0], data[j][0], data[j][0]);
    }
    /* Sort array using Quicksort algorithm: */
    puts("Sorting...");
    qsort(data, ROWS, sizeof *data, compare);
    puts("First 10 sorted numbers:");
    for(size_t j=0;j<10;j++){
        printf("Line %zu: %.3lf, %.3lf, %.3lfn", j, data[j][0], data[j][0], data[j][0]);
    }
    fclose(fp);
    free(data);
    return 0;
}
int compare(const void *arg1, const void *arg2) {
    double (*x)[3] = arg1;
    double (*y)[3] = arg2;
    if ((*x)[0] > (*y)[0])
        return 1;
    else if ((*x)[0] < (*y)[0])
        return -1;
    else if ((*x)[1] > (*y)[1])
        return 1;
    else if ((*x)[1] < (*y)[1])
        return -1;
    else if ((*x)[2] > (*y)[2])
        return 1;
    else if ((*x)[2] < (*y)[2])
        return -1;
    else
        return 0;
}

尝试使用结构体来代替数据:

typedef struct {
    double x;
    double y;
    double z;
} point_data;

那么你只需要一个这种新类型的一维数组:

point_data *array = malloc(linesRead * sizeof *array);

你的比较函数仍然相当相似:

int compare(const void *arg1, const void *arg2) {
    point_data *point1 = arg1,
               *point2 = arg2;
    if ( point1->x > point2->x ) {
        return 1;
    else if ( point1->x < point2->x ) {
        return -1;
    } else {
        if ( point1->y > point2->y ) {
            return 1;
        else if ( point1->y < point2->y ) {
            return -1;
        } else {
            if ( point1->z > point2->z ) {
                return 1;
            else if ( point1->z < point2->z ) {
               return -1;
            } else {
               return 0;
            }
        }
    }
}

还有,请不要硬编码点数,而是计算你读进去的数

相关内容

  • 没有找到相关文章

最新更新