使用AWK从数据集提取特定列



我正在尝试将简单的尴尬脚本应用于数据集文件。该文件有150列,我只需要20至30列。

以下是我用来获取20到30之间的记录的脚本。

代码

BEGIN{}
{
for(f=20;f<=30;f++){
    print $f;
    }
}

我不知道为什么我在下一行中获得10个字段的每个值。

就是

示例数据集

1 2 3 4 5 6 7
2 2 3 4 5 6 7 
3 3 3 4 5 6 7
4 4 4 4 5 6 7
5 5 5 5 5 6 7
6 6 6 6 6 6 7
7 7 7 7 7 7 7
I get output as 
1
2
3
4
5
6
7
2
2
3
4
5
6
7
...so on

下面是做相同

的另一种方式
awk -v f=20 -v t=30 '{for(i=f;i<=t;i++) 
                     printf("%s%s",$i,(i==t)?"n":OFS)}' file

注释

  1. ft分别是开始列和结尾列。
  2. 我们使用三元运算符来控制所需列之间的场分离器。

编辑

如果您需要30列和最后一列,下面就足够了:

awk -v f=20 -v t=30 '{for(i=f;i<=t;i++) 
                         printf("%s%s",$i,(i==t)?OFS""$NF"n":OFS)}' file

解决方案

BEGIN{FS=" ";}
{
for(f=20;f<=30;f++){
    printf("%s ",$f);
    }print "";
}

最新更新