我想从一个文件中读取并写入一个文件。输入文件如下
<ORLANDO> <0%>
As I remember, Adam, it was upon this fashion bequeathed me by will but poor a thousand crowns, and, as thou sayest,
<ORLANDO>
"A s I r e m e m b e r A d a m i t w a s u p o n t h i s f a s h i o n b e q u e a t h e d m e b y w i l l b u t p o o r a t h o u s a n d c r o w n s a n d a s t h o u s a y e s t c h a r g e d m y b r o t h e r o n ..."
我写了一个java程序来删除带有标签的行,并将任何标点符号替换为空格。但是每个写出来的字母之间都有一个空格,而且在行与行之间有很多空白行。如何去除它们?。请帮助。String line=null;
try {
BufferedReader br=new BufferedReader( new FileReader("filename"));
PrintWriter writer = new PrintWriter(new FileWriter("filename"));
try {
while((line=br.readLine())!=null)
{
if(!line.contains("<"))
{
line=(line.replaceAll("\p{Punct}",""));
writer.println(line);
writer.flush();
}
}
}
当你用printwwriter打开一个文件时,默认情况下它会截断文件。您可以将其设置为追加,但无论哪种方式都不能重写您正在以这种方式读取的文件。
相反,您应该创建一个新文件并写入该文件。当您完成后,您可以删除原始文件并重命名副本(或删除副本,如果它完全相同)但是每个写出来的字母之间都有一个空格,而且在行与行之间也有很多空行。
如果你写的是UTF-16,但读成ASCII或UTF-8,就会发生这种情况。避免这种情况的方法是不使用UTF-16,这不是默认的。
try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("filename"), StandardCharsets.UTF_8));
PrintWriter pw = new PrintWriter(new OutputStreamWriter(new FileOutputStream("filename.tmp"), StandardCharsets.UTF_8))) {
for(String line; (line = br.readLine())!=null;) {
pw.println(line.replaceAll("<[^>]+>", ""));
}
}
您是否使用正确的编码打开写入文件?看起来您编写了UTF-8,并使用ASCII或任何ISO-8859编码打开它。