我有一个大型csv文件"test.csv",其行数为:
$ wc -l test.csv
2154868
而如果我计算该文件中的第一列,即日期列,则其计数为:
$ cat test.csv | grep -w "2021-06-04" | wc -l
2154855
由于查询的原因,日期代码字段从不为空,并且始终相同。那么,行数怎么会如此不同呢?
示例文件数据:
DATECODE|SKUCODE|SUPPLIERCODE|SUP_NAME|PRIMARY_SUPPLIER_IND|IS_VPN|IS_DIFFCODE|IS_DIFF_DIFFCODE|IS02_DIFF03_DIFFCODE|IS_DIFF04_DIFFCODE
2021-06-04|106|02971|AAAAA, INC.|Y|58730|2X (2X)|20MM (20MM)|SILVER (SILVER)|GLOSS (GLOSS)
2021-06-04|119|02080|BBBB|Y|CI400||||
2021-06-04|1194|02080|BBBB|Y|AT419||||
运行grep -vw "2021-06-04" test.csv
以查看要过滤掉的行。