小贝子编程

在python中基于2列同时删除数据集中的重复项

本文关键字：集中数据集数据删除 python 2列 python pandas duplicates
更新时间 : 2023-09-22
英文 : Removing duplicates in a dataset in python based on 2 columns simulataneously

我有一个pandas数据框架，希望根据两个特定列的条目是否重复来删除行，从第一行开始向下进行(保留第一个hit并删除其他重复项)。

例如:

90 85827974

我不知道有什么直接的方法可以用col1或col2的方式来删除重复项，而不是AND，但是您可以简单地使用for循环来顺序删除您想要的列上的重复项。

for col in ['Group_1', 'Group_2']:
df.drop_duplicates(subset=col, inplace=True)

或

for col in df.columns[:2]:
df.drop_duplicates(subset=col, inplace=True)

它也会自动保留第一次出现，但你可以在方法中指定它:df.drop_duplicates(subset=col, inplace=True, keep='first')

最新更新

在初始页面加载时未应用FacetWP查询顺序数组设置
GitHub邀请过期吗?
使用AWS秘密管理器端点的安全组
如何做基于名称和值的点击事件？
在容器和主机上创建具有相同Linux用户id的用户
Firebase身份验证在部署后不工作.扑动Web应用程序显示空白的白色屏幕
AWS Client VPN Access Public URL/IP
python dict get方法即使key在dict中也运行第二个参数
如何在Python中使用每周时间序列
Scss函数没有返回计算值
如何使用conduit获取一个lazy ByteString并将其写入文件(在恒定内存中)
c -内存分配器-简单隔离存储:你如何从它的地址推断分配块的大小?
获取JSON格式的Discord PY对象
如何为作为prop传入的React组件设置类型
在c++中使用new时是否按顺序分配内存?
你可以暂时复制谷歌云图像文件在Python?
PHP cURL 一个帖子但两次(双)它是相同的数据到数据库与 API
405 (Method Not Allowed)错误的ajax在Laravel 8
Sicstus:一个模块和CWD
Laravel在模型中有onethrough关系
Whiptail:当一个仪表正在运行时，我该如何处理一个错误?
关于Sacha Willems的示例代码的Vulkan屏幕外渲染问题
有人可以分解nums[i] = nums[i-1] + nums[i]做什么?(Python) &g
如何在 Qwidget 上绘制二维码，我在 Windows 10 上使用 Qt Creator C++
Fluentd td-agent.log文件大小持续增加
暂停javascript for循环，同时等待从突变观察者的响应?
Jetpack撰写更新广告横幅在Android视图
在ASP中构建级联下拉列表的问题. NET Core 7 MVC使用JQuery和ajax.googleapis.com
在EAS中找不到"expo dev client"错误所依赖的"expo devel la
需要帮助在文件之间本地共享Javascript变量

在python中基于2列同时删除数据集中的重复项

相关内容

最新更新

热门标签：