我正在制作一个加载小文本文件的c程序。我将读取的文本文件内容存储在字符数组中。这是加载文件的函数。
void load_text_file(char* filename) {
FILE *fp;
char *buf = malloc(255 * sizeof(char));
if (!buf) return NULL;
fp = fopen(filename, "r");
fgets(buf, 255, (FILE*)fp);
int i;
for(i=0;i<255;i++) {
printf("%d - %cn", i, buf[i]);
}
}
当for循环打印输出时,会发生这种情况 (这是输出的缩短版本,我不想把所有255个字符都放在这个问题中。(
0 - H
1 - e
2 - l
3 - l
4 - o
5 -
6 - W
7 - o
8 - r
9 - l
10 - d
11 - !
//Random chars past this point
12 -
13 -
14 - „
15 -
16 - „
//etc... etc... etc...
96 - Å
97 -
98 -
99 - Å
100 - å
101 - è
102 -
//etc... etc... etc...
//all the way up to 255 chars
我不确定是什么原因造成的。
我想知道是什么导致了这种情况,以及如何修复它。
您应该将buf
打印为:
printf("%sn", buf);
您看到的垃圾是为具有malloc
的buf
分配的未初始化RAM内存,而fgets
未触及该内存。
您所观察到的并不令人惊讶,让我们检查一下您的代码:
fgets(buf, 255, (FILE*)fp);
首先,没有理由将fp
强制转换为(FILE*)
。fp
是用正确的类型定义的,并且强制转换指针是一个坏习惯,这通常会导致代码不可读和有缺陷。
fgets(buf, 255, fp)
尝试从流中读取多达254个字符,在第一个'n'
处停止。它返回一个指向buf
的指针,除非无法读取任何字符,在这种情况下,缓冲区的内容是不确定的,并返回NULL
。
您应该测试这个返回值,以验证是否确实从流中读取了字符,否则缓冲区的内容可能是随机字符,可能是malloc()
找到可用内存的堆空间中已经存在的字符。
当fgets()
遇到换行时,或者如果254个字符已存储到缓冲区时,它会在读取字符后存储一个' '
字节,并返回一个指向缓冲区的指针。超过这个NUL字节的缓冲区内容是不确定的,如上所述,它们可能是NUL或明显的随机字符,或者任何东西。。。
你应该用这种方式重写你的循环,只转储有意义的字符:
void load_text_file(const char *filename) {
char *buf = malloc(255 * sizeof(char));
if (!buf) { printf("could not allocate memoryn"); return; }
FILE *fp = fopen(filename, "r");
if (!fp) { printf("could not open filen"); return; }
if (fgets(buf, 255, (FILE*)fp)) {
for (int i = 0; buf[i] != ' '; i++) {
printf("%d - %cn", i, buf[i]);
}
... // do something else with `buf`
}
fclose(fp);
free(buf);
}
fgets
读取到流的末尾(本例中为前254个字符(或遇到第一个' '
。如果您正在读取超过任何' '
的内容,您将获得垃圾值作为输出。因此,与其执行循环到255,不如只执行循环到找到第一个' '
。