小贝子编程

CSV 删除第二列中的重复项而不删除第一行

本文关键字：删除一行二列 CSV sorting awk duplicates
更新时间 : 2023-09-16
英文 : CSV remove duplicates in 2nd column without deleting first row

我有一个 csv，有 17 列和许多 1000 行。在第 2 列中，我试图删除重复项，但保留第一个。

文件示例：

1001,Henry
1002,Dave
1003,Dave
1004,Tom

当我运行时：

sort -t, -k2,2 -u file.csv -o newfile.csv

新文件.csv包含(错误(

1001,Henry
1004,Tom

期望的输出：

1001,Henry
1002,Dave
1004,Tom

我也尝试了几件事，没有运气。提前感谢！

试试这个，

awk -F ',' '!seen[$2]++' file.csv > newfile.csv

此命令告诉 awk 要打印哪些行。变量 $2 保存第 2 列的全部内容，方括号是数组访问。因此，对于文件名中每第二行，如果之前未设置该节点(column2(的内容，则名为 seen 的数组的节点将递增并打印该行。

最新更新

是否有办法捕获HTTP响应中的错误(例如状态码500)，然后在selenium中失败脚本?
mysql恢复命令和授予特权
在r中使用lubridate make_datetime后的未知日期列类
如何从Firebase认证获得Twitter用户名- Javascript
在哪里存储凭证和其他机密的Apache Flink SQL?
包含具有相同外键的相关对象的查询集
为什么getter触发器有时在模板中?
使用ansible访问字典文件列表
奇怪的uint8_t转换与OpenCV
C语言在介子中的覆盖报告
如何根据第二个表的条件从一个表中选择值?
为什么在下一个.js " use client "组件顶部给我这个错误？
正在文本文件中搜索字符串，但得到多个结果
如何在链表中使用复制赋值操作符
CycloneDX v2.1.2 -如何使用CycloneDX v2.1.2为.net框架项目生成依赖关系图
如何对一般嵌套的TypedDict进行类型注释?
Web代码只是不工作-文本不断弹出动画后
如何使用VBA根据电子邮件的主题提取Outlook电子邮件数据?
为什么 H2 不能创建此表？
按下按钮后功能并行或同时计算
Gradle无法获取Unity Mediation、Firebase和Google Play Service的依赖项.&
使用两个表在mysql数据库中按国家查找用户
如何从appsettings.json获得日期时间?
配置组到springdoc openapi
用连字符替换laravel路由URL模式中的正斜杠
获胜团队(班级)场景
可以解构来自SWR查询的结果吗?
如何添加已配置的GKE节点池访问范围
Tomcat 10.1 尝试加载自定义标记，但找不到类"javax.servlet.jsp.tagext.Tag"
如何根据RFC 3984从RTP包中提取H264视频?

CSV 删除第二列中的重复项而不删除第一行

相关内容

最新更新

热门标签：