使用Shell脚本来解析CSV文件

我一直在尝试编写脚本，该脚本将解析CSV文件并以指定格式提供输出。

输入文件以下面的格式。

collectionBeginTime,ID,MU,hostname,Granularity,SampleInterval,suspectFlag,memCpuUsage,memUsedMemory,memMemoryCapacity,memRequestNum,memOnlineUserNum,memUsedLogDisk,memLogDiskCapacity,freeCPUUsage,freeMemory,freeLogDisk
2015-11-27 17:30:00-0500,NE=2106384,hwMEMPerformanceCollect,PG_172.16.169.70,900,900,0,24,7130,36153,0,1554,23026,157239,76,29023,134213
2015-11-27 17:30:00-0500,NE=2106386,hwMEMPerformanceCollect,PG_172.16.169.68,900,900,0,4,7481,36153,0,1594,22778,157239,96,28672,134461

输出预计将处于格式（仅显示输入第一行的少数输出线）：

collectionBeginTime   ,     hostname     ,     Parameters
2015-11-27 17:30:00-0500, PG_172.16.169.70, SampleInterval:900
2015-11-27 17:30:00-0500, PG_172.16.169.70, suspectFlag:0

我需要在第一条线后为每行打印第1和4列，然后是列名（来自文件的第1行），:和列6..NF的列值（忽略列2、3，3，总共5个）。单个输入线生成许多输出线。

我写的脚本：

#!/bin/bash
FILENAME=$1
awk -F',' 'BEGIN{OFS=",";}  { if ( NR!=1 )print $1,$4,$6,$8,$9,$10,$11,$12,$13,$14,$15,$16,$17}' < $FILENAME >> tmp.txt
echo "completed"

脚本正在运行，但在同一行上显示所有参数，没有其名称。我如何解决它？

您捕获第1行中的字段以进行重复使用。在其他行中，您在字段上迭代6..nf打印相关数据：

awk -F',' 'NR == 1 { for (i = 6; i <= NF; i++) name[i] = $i
                     printf "%s, %s, %sn", $1, $4, "Parameters"; next }
           { for (i = 6; i <= NF; i++) printf "%s, %s, %s:%sn", $1, $4, name[i], $i; }'

^{未经测试的代码。}

相关内容

最新更新

热门标签：