从文件中的单词中删除字母 C - 有问题的符号



准确地说,我正在尝试从文件 A 复制到文件 B,每个没有字母"e"和"t"的单词(the、peter 等),程序工作正常,但在输出文件的末尾我得到了一个奇怪的标志。

Input: What says Lucentio to this shame of ours?
Output: What says  to this shame of ours?˙

(你能˙看到角色吗?

我不想要它,我不知道那是什么,但它不是 EOF,我试图从复制中取消它,但它不起作用。我在这里需要一些帮助。

法典:

char signHold[1];
int main(int *argc, char** argv)
{
    FILE* infile;
    FILE* outfile;
    char* string = NULL;
    if(argc != 3)
    {
        printf(stderr,"Error: Improper number of arguments");
        return EXIT_FAILURE;
    }
    remove(argv[2]);
    infile = fopen(argv[1],"r");
    while(feof(infile) == 0)
    {
        string = getWord(infile);
        if(checkDenied(string))
        addToFile(outfile, argv[2], string);
        addToFile(outfile, argv[2], signHold);
    }
    fclose(infile);
    free(string);
    return EXIT_SUCCESS;
}
char* getWord(FILE* ptr)
{
    char* tempString;
    size_t memSize = 0;
    int c;
    tempString = expandRealloc(NULL,sizeof(char));
    while(c = fgetc(ptr))
    {
        if(isalpha(c) != 0)
        {
            tempString = expandRealloc(tempString, (memSize+1)*sizeof(char)+1);
            tempString[memSize] = c;
            memSize++;
        }
        else
        {
            signHold[0] = c;
            break;
        }
    }
    tempString[memSize] = '';
    return tempString;
}
short int checkDenied(const char* str)
{
    int i;
    i = strspn("e", str);
    if(i >= 1)
    {
        i = strspn("t", str);
        if(i >= 1)
        {
            return EXIT_SUCCESS;
        }
    }
    return EXIT_FAILURE;
}
short int addToFile(FILE* ptr, char* directory, char* text)
{
    ptr = fopen(directory,"a+");
    fprintf(ptr,"%s", text);
    fclose(ptr);
    return EXIT_SUCCESS;
}

首先,您假设fgetc在文件末尾返回0,但事实并非如此。它返回EOF .也许您正在阅读EOF,将其分配给一个signHold[0]字符(这可能会导致任何事情,因为EOF不适合char

然后,您继续打印包含随机字符的signHold,后跟谁知道什么,因为字符串不是以 NUL 结尾的(它的大小为 1,它的第一个字符不是 ' ' .也就是说,您正在打印任何可能发生在signHold之后的东西。(顺便说一下,这也是未定义的行为)。

这是状态机。让它使用可变大小的缓冲区留给读者一个练习;-)

#include <stdio.h>
#include <stdlib.h>
#include <ctype.h>
int main(int argc, char **argv)
{
    FILE *infile;
    FILE *outfile;
    char buff[100];
    size_t len,idx;
    int ch, state;
    if(argc != 3)
    {
        fprintf(stderr,"Error: Improper number of arguments");
        return EXIT_FAILURE;
    }
    infile = fopen(argv[1],"r");
    outfile = fopen(argv[2],"w");
    len = 0;
    for (state=0; state >= 0; ) {
        ch = fgetc(infile);
        if (isalpha(ch)) {
            if (ch == 'e') state |= 1;
            else if (ch == 't') state |= 2;
            if (state != 3) buff[len++] = ch;
            continue;
        }
    /* no character, this must be the end of a word. */
        if (state != 3) for(idx=0; idx < len; idx++ ) {
            fputc(buff[idx], outfile);
            }
        if (ch == EOF) {state = -1; continue;}
        fputc(ch, outfile);
        len = 0; state = 0;
        }
    fclose(infile);
    fclose(outfile);
    return EXIT_SUCCESS;
}

我相信它是存储在signHold[1]的垃圾内存。 您只允许 1 个字符,并且不以 NUL 终止它。 这意味着当你写出问号时,它也会写出它之后第一个"\0"之前的任何内存。

最新更新