使用 Perl 删除 csv 文件中"blank"行或坏行。



我正在做一个项目,该项目从一个非常旧的应用程序(DOS基础应用程序)导出.csv文件。导出是有效的,但它会截断一列(看起来是随机的)并将其插入下一行。它通常是单词的后半部分或类似的东西。我想知道的是,是否有办法使用Perl来删除这些行。我目前使用Perl脚本删除所有逗号分隔符,并用管道(|)分隔符替换它们。我发现使用管道可以更容易地插入SQL中使用。我对Perl非常非常陌生,但这段代码可以完美地用管道代替逗号。有没有一种方法可以使用它并删除"坏"行。我曾尝试使用大容量插入导入SQL,但收到诸如"第49行第17列的大容量加载数据转换错误(截断)"之类的错误。我希望我说清楚了。谢谢你的帮助。

use strict;
use warnings;
use Text::CSV_XS;
my $in_file = "Deal_Log.csv";
my $out_file = "NewDeal.csv";
open my $fh, '<', $in_file or die "$in_file: $!";
open my $out_fh, '>', $out_file or die "$out_file: $!";
my $in_csv = Text::CSV_XS->new;
my $out_csv = Text::CSV_XS->new( { sep_char => '|', eol => "n" } );
while( my $row = $in_csv->getline( $fh ) ) { 
    $out_csv->print( $out_fh, $row );
}

不要立即输出行。相反,请阅读下一行并检查列数。如果全部为17,则输出前一行,否则将该行附加到前一记忆行。

#!/usr/bin/perl
use warnings;
use strict;
use Text::CSV_XS;
my $in_file  = 'Deal_Log.csv';
my $out_file = 'NewDeal.csv';
my $size     = 17;
open my $fh,     '<', $in_file  or die "$in_file: $!";
open my $out_fh, '>', $out_file or die "$out_file: $!";
my $in_csv  = 'Text::CSV_XS'->new;
my $out_csv = 'Text::CSV_XS'->new( { sep_char => '|',
                                     eol      => "n",
                                   } );
my $previous = [];
while( my $row = $in_csv->getline($fh) ) {
    if (@$row == $size) {
        $out_csv->print($out_fh, $previous) if @$previous;
        $previous = $row;
    } else {
        $previous->[-1] .= $row->[0];
    }
}
$out_csv->print($out_fh, $previous);  # Do not forget to print the last remembered line.

我最近在使用Text::CSV_XS时遇到了类似的问题。几个"随机"行被截断并与下一行合并。在截断的行中,一些内容实际上丢失了,字段分隔符和行分隔符也丢失了。

在接受性能处罚时,我求助于文本::CSV_PP,问题就消失了。如果您的CSV创建不是时间关键型的,我建议您尝试Text::CSV_PP,因为对于大文件,创建速度肯定较慢。

最新更新