我正在做一个项目,该项目从一个非常旧的应用程序(DOS基础应用程序)导出.csv文件。导出是有效的,但它会截断一列(看起来是随机的)并将其插入下一行。它通常是单词的后半部分或类似的东西。我想知道的是,是否有办法使用Perl来删除这些行。我目前使用Perl脚本删除所有逗号分隔符,并用管道(|)分隔符替换它们。我发现使用管道可以更容易地插入SQL中使用。我对Perl非常非常陌生,但这段代码可以完美地用管道代替逗号。有没有一种方法可以使用它并删除"坏"行。我曾尝试使用大容量插入导入SQL,但收到诸如"第49行第17列的大容量加载数据转换错误(截断)"之类的错误。我希望我说清楚了。谢谢你的帮助。
use strict;
use warnings;
use Text::CSV_XS;
my $in_file = "Deal_Log.csv";
my $out_file = "NewDeal.csv";
open my $fh, '<', $in_file or die "$in_file: $!";
open my $out_fh, '>', $out_file or die "$out_file: $!";
my $in_csv = Text::CSV_XS->new;
my $out_csv = Text::CSV_XS->new( { sep_char => '|', eol => "n" } );
while( my $row = $in_csv->getline( $fh ) ) {
$out_csv->print( $out_fh, $row );
}
不要立即输出行。相反,请阅读下一行并检查列数。如果全部为17,则输出前一行,否则将该行附加到前一记忆行。
#!/usr/bin/perl
use warnings;
use strict;
use Text::CSV_XS;
my $in_file = 'Deal_Log.csv';
my $out_file = 'NewDeal.csv';
my $size = 17;
open my $fh, '<', $in_file or die "$in_file: $!";
open my $out_fh, '>', $out_file or die "$out_file: $!";
my $in_csv = 'Text::CSV_XS'->new;
my $out_csv = 'Text::CSV_XS'->new( { sep_char => '|',
eol => "n",
} );
my $previous = [];
while( my $row = $in_csv->getline($fh) ) {
if (@$row == $size) {
$out_csv->print($out_fh, $previous) if @$previous;
$previous = $row;
} else {
$previous->[-1] .= $row->[0];
}
}
$out_csv->print($out_fh, $previous); # Do not forget to print the last remembered line.
我最近在使用Text::CSV_XS时遇到了类似的问题。几个"随机"行被截断并与下一行合并。在截断的行中,一些内容实际上丢失了,字段分隔符和行分隔符也丢失了。
在接受性能处罚时,我求助于文本::CSV_PP,问题就消失了。如果您的CSV创建不是时间关键型的,我建议您尝试Text::CSV_PP,因为对于大文件,创建速度肯定较慢。