小贝子编程

Pandas:计算连续重复项(不使用循环)并将列添加到原始数据帧

本文关键字：添加数据帧原始数据原始循环连续计算 Pandas python pandas dataframe
更新时间 : 2023-09-16
英文 : Pandas: Count consecutive duplicates (not with loop) and add column to original DataFrame

import pandas as pd
value = [1,1,2,2,2,1,2,2,2,3,3,4]
df = pd.DataFrame(value)
df['count'] = [2,2,3,3,3,1,3,3,3,2,2,1]

我想生成"计数"列，但不要使用循环，因为原始数据很大。

是否有功能或其他有效的方法来做到这一点？

使用GroupBy.transform表示由counts 填充的新列，Series由shiftd 列ne(!=( 创建，并为连续组添加cumsum：

df['count'] = df.groupby(df[0].ne(df[0].shift()).cumsum())[0].transform('size')
print (df)
0  count
0   1      2
1   1      2
2   2      3
3   2      3
4   2      3
5   1      1
6   2      3
7   2      3
8   2      3
9   3      2
10  3      2
11  4      1

最新更新

无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?
无法使用 conda env 导入 OCI 笔记本会话中的模型配置详细信息
c - while循环中VSC的分段错误
无法将url数据获取到模型类中
如何将DataGridTextColumn绑定到WinUI3中绑定的对象中的方法?
错误在cobol程序上打开VB文件来处理XML文件
while循环在python中没有爆发
yii2查询具有多个非和或的数据提供程序
Libgdx:渲染方法
Pycharm 错误：预期类型 [类名] 改为"str"
运行我的代码时出现错误:未知的自定义元素
在Selenium 4中使用Behat和Mink Selenium2驱动程序为Microsoft Edge浏览器运行测试
宽度未知的可变列数
我必须在.env文件中存储哨兵公钥吗?
Mongodb子文档没有自动生成对象id Typegoose/ mongoose
类型中构造函数的参数 0 需要找不到类型为"org.hibernate.SessionFactory"的 Bean
根据r中的日期和小时每隔15分钟聚合数据
如何解决关于Optuna存储的错误?
c语言中OO继承的混叠问题
launchWebAuthFlow窗口在chrome扩展关闭后保持打开
使用非初始结构变量作为参数调用函数不会产生警告
Pytorch - mat1和mat2形状不能相乘(3328x13和9216x4096)
我如何得到一个节点超时的内部id使用符号没有硬编码查找索引?
spring引导应用程序读取另一个jar的应用程序配置值吗?
如何在main.js中导入javascript库以在整个vue应用程序中获得全局可用性?
使段落出现，并使其在点击显示下一个段落时消失
GROUP_CONCAT(DISTINCT xxx)将连接值的顺序颠倒
r语言 - 循环遍历列表的列表

Pandas:计算连续重复项(不使用循环)并将列添加到原始数据帧

相关内容

最新更新

热门标签：