我编写的程序获取一个文件的大小,从该文件读取partSize数量的字节,并将partSize数量的字节写入新创建的文件。问题是它只适用于小文本文件。如果我尝试用几百行文本文件或图片运行程序,我会得到分割错误,并且存储在新文件中的字节明显少于partSize。
#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <unistd.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <errno.h>
int main()
{
int createDescriptor;
int openDescriptorOriginal;
int closeCreateDescriptor;
// char fileNameOriginal[] = "picture.jpg";
char fileNameOriginal[] = "myFile.txt";
int parts;
int partSize;
parts=2;
int bytesRemaining;
int partNumber;
char BUFFER[512];
int readDescriptor;
int buffer[1];
oid *pbuffer = &buffer;
int bytes, infile, outfile;
if ((openDescriptorOriginal = open(fileNameOriginal, O_RDONLY )) == -1)
{
printf("Error opening %s", fileNameOriginal);
exit(EXIT_FAILURE);
}
struct stat buf;
int r = fstat(openDescriptorOriginal, &buf);
if (r)
{
fprintf(stderr, "error: fstat: %sn", (char *) strerror(errno));
exit(1);
}
int originalFileSize = buf.st_size;
printf("The file is %.9f bytes large.n",(double)originalFileSize);
partSize = ((originalFileSize + parts) - 1)/parts;
printf("Part size: %.9f bytes largen",(double)partSize);
umask(0000);
//create and open new file
if ( (outfile = open("NewPicture.jpg", O_CREAT|O_WRONLY,0777))==-1 )
{
printf("ERROR %sn", "NewPicture.jpg");
}
ssize_t count, total;
total = 0;
char *bufff = BUFFER;
while (partSize) {
count = read(openDescriptorOriginal, bufff, partSize);
if (count < 0) {
break;
}
if (count == 0)
break;
bufff += count;
total += count;
partSize -= count;
}
write (outfile, BUFFER, total);
printf("n");
return 0;
}
您使用的缓冲区只有512字节。
BUFFER[512];
如果该文件中的内容超过此限制,将发生seg错误
您的缓冲区太小。您需要一个更大的缓冲区变量。如果你的文件大小超过512字节,你会有段错误。
理想情况下,应该以固定的块从文件中读取。也就是说,每次读取可能读取30-40个字符或固定数量的字符,然后将其写入新文件。重复此操作,直到读取完整个文件。
count = read(openDescriptorOriginal, bufff, partSize);
本行第3个参数错误,
在您的代码中,您已经定义了char BUFFER[512];
,使用BUFFER
从文件读取仅511字节的时间。
count = read(openDescriptorOriginal, BUFFER, 512);
不使用大赞的原因:
如果partSize
>然后 512
,则可能发生缓冲区溢出(缓冲区溢出)。这就是为什么你不能处理大文件的原因。因为read()
函数将尝试从与打开的文件描述符openDescriptorOriginal
(fildes)相关联的文件中读取partSize
字节到buffer所指向的只有512
字节长的缓冲区中。此缓冲区溢出是程序中分段错误的原因。
如果文件大小较小,则代码将工作。
我已经修改了你的代码:
ssize_t count=0, total=0;
total = 0;
char *bufff = calloc(partSize+1, sizeof(char));
char *b = bufff;
while (partSize > 0) {
count = read(openDescriptorOriginal, b, 512);
if (count < 0) {
break;
}
if (count == 0)
break;
b = b + count;
total = total + count;
partSize = partSize - count;
}
write (outfile, bufff, total);
close(openDescriptorOriginal);
close(outfile);
这里没有意义
partSize = ((originalFileSize + parts) - 1)/parts;
您已将parts
初始化为2,然后将2添加到原始文件大小并减去1,然后再除以2,即使在一天结束时您的缓冲区大小为512?
你需要做的是在读取文件时使用缓冲区大小并检查实际读取了多少字节,这个值从原始文件大小中减去,重复直到实际读取的字节小于缓冲区大小和/或原始文件大小为0。
如果你没有任何特殊的原因想要使用非缓冲I/O,那么使用文件缓冲I/O(即fopen/fread/fwrite/fclose
)可能会更好。