我有一个很大的CSV文件,它有很多列,而且很多列都有时间戳。我想只根据其中1列筛选特定年份的数据。
我的一些输入CSV看起来像的例子:(没有头)
<表类>
tbody><<tr>17263847 11/20/2018 3:00:13点 11/23/2018 6:45:00是 批准 19483742 12/22/2019 4:00:12点 1/10/2020 4:50:11是 批准 38274938 10/10/2018 2:02:19点 02/07/2019 1:04:15点 批准 表类>
-
首先,在awk中,第二列不是
$1
,而是$2
(请记住,$0
指的是整行/寄存器)。 -
第二:代替
==
文字比较,使用匹配~
的正则表达式(我找到的第一个教程)。
您需要的命令是:
awk -F, -e '$2 ~ /2019/' file1.csv > file2.csv