在最后一列标题下打印比较结果

我正在使用文件1的第一列与文件2的第一列对2个文件file1，file2进行比较，并从第7列中检索相应的值。

awk -F, 'FNR==NR{a[$1]=$7;next} {print (($1 in a) ? $0","a[$1] : $0",NA");}' file2.txt file1.txt > tmp && mv tmp file1.txt

同样在第二天，它将比较并附加结果。

cat file1.txt 
N1,N2,N3,N4,N5,N6,D1,D2,D3,D4,D5,D6,D7,D8,D9,D10
XX,ZZ,XC,EE,RR,BB,OK,OK,OK,OK,OK,OK,OK,OK
XC,CF,FG,RG,GH,GH,NA,NA,NA,NA,NA,NA,NA,NA,NA
DM,DF,GR,TH,EW,BB
cat file2.txt 
cat file2.txt
DF,GH,MH,FR,FG,GH,NA
XX,ZZ,XC,EE,RR,BB,OK
awk -F, 'FNR==NR{a[$1]=$7;next} {print (($1 in a) ? $0","a[$1] : $0",NA");}' file2.txt file1.txt > tmp && mv tmp file1.txt

MV：覆盖"file1.txt"？

 cat file1.txt
N1,N2,N3,N4,N5,N6,D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,NA ---> Header
XX,ZZ,XC,EE,RR,BB,OK,OK,OK,OK,OK,OK,OK,OK,OK,OK
XC,CF,FG,RG,GH,GH,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA
DM,DF,GR,TH,EW,BB,NA

添加新行后

DM,DF,GR,TH,EW

问题是它正在比较和打印标题的结果，并且打印了结果在标题 D1 下，而不是 D10 下，用于 file1 中新插入的行

我们如何这样打印，比较应该排除最后一列标题下的标题和结果

N1,N2,N3,N4,N5,N6,D1,D2,D3,D4,D5,D6,D7,D8,D9,D10
XX,ZZ,XC,EE,RR,BB,OK,OK,OK,OK,OK,OK,OK,OK,OK,OK
XC,CF,FG,RG,GH,GH,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA
DM,DF,GR,TH,EW,BB                           ,NA

为避免更新标头，请将 awk 的表达式更改为以下内容：

'FNR==NR{a[$1]=$7;next} FNR==1{print $0; next} {print (($1 in a) ? $0","a[$1] : $0",NA");}'

在这种情况下，file1.txt的第一行将按原样打印，没有任何更改。

但是，您是否还需要在每次运行时将新的一天（如示例中的"D10"）添加到标题中？还是你在别处做？

至于第二个问题（在字符串中较短行与较长行的相同位置打印新值），您应该进一步修改 awk：

'FNR==NR{a[$1]=$7;next} FNR==1{print $0; len=length($0); next} {printf $0; cont=(($1 in a) ? ","a[$1] : ",NA"); for (i=length($0)+1;i<=len-length(cont);i++) printf " " ; print cont;}'

相关内容

最新更新

热门标签：