小贝子编程

循环通过过滤熊猫数据帧的最佳方式

本文关键字：最佳方式数据帧熊猫过滤循环 python pandas dataframe performance
更新时间 : 2023-09-21
英文 : Best way to loop through a filtered pandas Dataframe

我需要循环通过pandas DataFrame，但首先我必须对其进行过滤；old_id"；s附加到每个新ID。

我写了这个代码，运行得很好，但它的伸缩性不太好。

d = dict()
for new_id in (new_id_list):

d[new_id] = df[df['new_id_col'] == new_id]['old_id'].nunique()

如何提高效率？

看起来您正在寻找groupby+nunique。这获取唯一的"；old_id"；s每"；new_id_col"：

out = df.groupby('new_id_col')['old_id'].nunique().to_dict()

最新更新

我的prinln方法没有输出我想要的相同输出
azure function poppler utils
r语言 - 取对角矩阵的幂
multiplication Table in dart
如何捕获从装饰器抛出"FilesInterceptor"错误
错误:fatal:不是git存储库(或任何父目录):.git云源存储库
创建一个Python字典，以开始值和结束值作为键
根据列唯一值对组执行多元线性回归
如何在VS Code中添加扩展的Git提交消息
是否有办法捕获HTTP响应中的错误(例如状态码500)，然后在selenium中失败脚本?
mysql恢复命令和授予特权
在r中使用lubridate make_datetime后的未知日期列类
如何从Firebase认证获得Twitter用户名- Javascript
在哪里存储凭证和其他机密的Apache Flink SQL?
包含具有相同外键的相关对象的查询集
为什么getter触发器有时在模板中?
使用ansible访问字典文件列表
奇怪的uint8_t转换与OpenCV
C语言在介子中的覆盖报告
如何根据第二个表的条件从一个表中选择值?
为什么在下一个.js " use client "组件顶部给我这个错误？
正在文本文件中搜索字符串，但得到多个结果
如何在链表中使用复制赋值操作符
CycloneDX v2.1.2 -如何使用CycloneDX v2.1.2为.net框架项目生成依赖关系图
如何对一般嵌套的TypedDict进行类型注释?
Web代码只是不工作-文本不断弹出动画后
如何使用VBA根据电子邮件的主题提取Outlook电子邮件数据?
为什么 H2 不能创建此表？
按下按钮后功能并行或同时计算
Gradle无法获取Unity Mediation、Firebase和Google Play Service的依赖项.&

循环通过过滤熊猫数据帧的最佳方式

相关内容

最新更新

热门标签：