在任何字段中按最高值排序



我想根据第2-8列中的值对文件进行排序?本质上,我希望根据任何字段中的行中出现的最高值,而忽略第1、9和10列的上升顺序。第二行等第二行等...如果上升顺序中的下一个数字出现在多行上(例如A/B),我不在乎打印的顺序。

我已经考虑使用 sort ,但无法找到一种简单的方法来做我想做的事情...

我有点困难,有什么想法吗?

输入:

#1     2     3     4     5     6     7     8     9    10
 A  0.00  0.00  0.01  0.23  0.19  0.07  0.26  0.52  0.78
 B  0.00  0.00  0.02  0.26  0.19  0.09  0.20  0.56  0.76
 C  0.00  0.00  0.02  0.16  0.20  0.22  2.84  0.60  3.44
 D  0.00  0.00  0.02  0.29  0.22  0.09  0.28  0.62  0.90
 E  0.00  0.00  0.90  0.09  0.18  0.05  0.24  1.21  1.46
 F  0.00  0.00  1.06  0.03  0.04  0.01  0.00  1.13  1.14
 G  0.00  0.00  1.11  0.10  0.31  0.08  0.64  1.60  2.25
 H  0.00  0.00  1.39  0.03  0.04  0.01  0.01  1.47  1.48
 I  0.00  0.00  1.68  0.16  0.55  0.24  5.00  2.63  7.63
 J  0.00  0.00  6.86  0.52  1.87  0.59 12.79  9.83 22.62
 K  0.00  0.00  7.26  0.57  2.00  0.64 11.12 10.47 21.59

预期输出:

#1     2     3     4     5     6     7     8     9    10
 A  0.00  0.00  0.01  0.23  0.19  0.07  (0.26)  0.52  0.78
 B  0.00  0.00  0.02  (0.26)  0.19  0.09  0.20  0.56  0.76
 D  0.00  0.00  0.02  (0.29)  0.22  0.09  0.28  0.62  0.90
 E  0.00  0.00  (0.90)  0.09  0.18  0.05  0.24  1.21  1.46
 F  0.00  0.00  (1.06)  0.03  0.04  0.01  0.00  1.13  1.14
 G  0.00  0.00  (1.11)  0.10  0.31  0.08  0.64  1.60  2.25
 H  0.00  0.00  (1.39)  0.03  0.04  0.01  0.01  1.47  1.48
 C  0.00  0.00  0.02  0.16  0.20  0.22  (2.84)  0.60  3.44
 I  0.00  0.00  1.68  0.16  0.55  0.24  (5.00)  2.63  7.63
 K  0.00  0.00  7.26  0.57  2.00  0.64 (11.12) 10.47 21.59
 J  0.00  0.00  6.86  0.52  1.87  0.59 (12.79)  9.83 22.62

预处理数据:在每行开始时打印第2至8列的最大值,然后排序,然后删除添加的列:

awk '
    NR==1{print "x ", $0} 
    NR>1{
        max = $2; 
        for( i = 3; i <= 8; i++ ) 
            if( $i > max )
                max = $i;
        print max, $0
    }' OFS=\t input-file | sort -n | cut -f 2-

另一个纯awk变体:

$ awk 'NR==1; # print header
     NR>1{ #For other lines,
         a=$2;
         ai=2;
         for(i=3;i<=8;i++){
             if($i>a){
                 a=$i;
                 ai=i;
                 }
             } # Find the max number in the line
             $ai= "(" $ai ")"; # decoration - mark highest with ()
             g[$0]=a;
         }
    function cmp_num_val(i1, v1, i2, v2) {return (v1 - v2);} # sorting function
    END{
        PROCINFO["sorted_in"]="cmp_num_val"; # assign sorting function
        for (a in g) print a; # print
    }' sortme.txt | column -t # column -t for formatting.
#1  2     3     4       5       6     7     8        9      10
A   0.00  0.00  0.01    0.23    0.19  0.07  (0.26)   0.52   0.78
B   0.00  0.00  0.02    (0.26)  0.19  0.09  0.20     0.56   0.76
D   0.00  0.00  0.02    (0.29)  0.22  0.09  0.28     0.62   0.90
E   0.00  0.00  (0.90)  0.09    0.18  0.05  0.24     1.21   1.46
F   0.00  0.00  (1.06)  0.03    0.04  0.01  0.00     1.13   1.14
G   0.00  0.00  (1.11)  0.10    0.31  0.08  0.64     1.60   2.25
H   0.00  0.00  (1.39)  0.03    0.04  0.01  0.01     1.47   1.48
C   0.00  0.00  0.02    0.16    0.20  0.22  (2.84)   0.60   3.44
I   0.00  0.00  1.68    0.16    0.55  0.24  (5.00)   2.63   7.63
K   0.00  0.00  7.26    0.57    2.00  0.64  (11.12)  10.47  21.59
J   0.00  0.00  6.86    0.52    1.87  0.59  (12.79)  9.83   22.62

相关内容

  • 没有找到相关文章

最新更新