Bash修改CSV以更改字段



我有一个非常大的CSV文件(大约10.000行和400列),我需要修改某些列(如15156220)以将格式从20140321132233更改为2014-03-21 13:22:33。我需要修改的所有字段都是日期时间。

我看到了一些使用awk但用于数学修改的例子。我可以用这样的东西来做上面的改变吗?

file.csv示例:

19238328932|123233443|123|0|||||123123|20140321132233|1|0|0|....|20130211122143|...
12332312211|222321233|111|0|||||234432|20150222122354|1|0|0|....|20120112123133|...

请将以下awk脚本保存为awk.src:

function date_str(val) {
  Y = substr(val,0,4);
  M = substr(val,5,2);
  D = substr(val,7,2);
  date = sprintf("%s-%s-%s",Y,M,D);
  return date;
}
function time_str(val) {
  h = substr(val,9,2);
  m = substr(val,11,2);
  s = substr(val,13,2);
  time = sprintf("%s:%s:%s",h,m,s);
  return time;
}
BEGIN {
  FS="|"
}
#
## MAIN Block
#
{
  for (i=1;i<=NF;i++) {
    if (i==10) {
      printf "%s %s", date_str($i), time_str($i);
    }
    else { printf $i; }
    if (i!=NF) {
      printf FS;
    }
    else { printf "n"; }
  }
}

现在试试,它应该打印:

$ awk -f awk.src csv 
19238328932|123233443|123|0|||||123123|2014-03-21 13:22:33|1|0|0|....|20130211122143|...
12332312211|222321233|111|0|||||234432|2015-02-22 12:23:54|1|0|0|....|20120112123133|...

最新更新