我有一个数据帧:
df = pd.DataFrame([[0,4,0,0],
[1,5,1,0],
[2,6,0,0],
[3,7,1,0]], columns=['index', 'A', 'class', 'label'])
p>用pandas.DataFrame.groupby
'class'
,取'A'
每组的groupby.mean
,检查boolean
系列astype
(int)
是否大于df['A'].mean()
,pandas.Series.map
是否大于df['class']
并分配给df['label']
:
>>> df['label'] = df['class'].map(
df.groupby('class')['A'].mean() > df['A'].mean()
).astype(int)
>>> df
index A class label
0 0 4 0 0
1 1 5 1 1
2 2 6 0 0
3 3 7 1 1
由于您只检查class
== 0,您需要在df['class']
上添加另一个boolean mask
:
>>> df['label'] = (df['class'].map(
df.groupby('class')['A'].mean() > df['A'].mean()
) & (~df['class'].astype(bool))
).astype(int)
index A class label
0 0 4 0 0
1 1 5 1 0 # because (5+7)/2 < (4+5+6+7)/4
2 2 6 0 0
3 3 7 1 0 # because (5+7)/2 < (4+5+6+7)/4
所以即使你的代码工作了,你也不会知道,因为条件没有得到满足。
如果我理解正确,如果您提到的条件被满足,那么所有行的标签都更改为1对吗?在这种情况下,你所做的是正确的,但你遗漏了一些东西,代码应该是这样的:
if df[df['class'] == 0]['A'].mean() > df['A'].mean:
df['label'] = 1
这应该可以工作。您所做的工作不工作,因为当您使用df[df['class']]时,您只选择了DataFrame的'class'列,因此您要修改的'label'列不称为
相关内容
- 用paste0为列的子集分配名称
- 我如何分配一个值给一个熊猫数据框架的随机子集?
- 如何分配一个张量的子集,但仍然保持原来的张量?
- 将可迭代对象返回的列表中的值的子集分配给变量(Python)
- 如何进行布尔索引,但同时将两个子集分配给一个变量
- r-有没有一种方法可以递归地对数据帧进行子集划分,并将新的数据帧分配给一个唯一的变量名
- 如何将子集合中的数据分配给其集合并呈现新对象?使用react、firebase和useeffect钩子
- 如何使用索引执行pandas数据帧子集设置并为其分配相同的值
- 使用MultiIndex为panda数据帧分配值的子集
- 目标和[leetcode]通过分配符号计数具有给定目标和的子集
- 通过 *loc* 将 np.array 列表分配给数据帧的行子集的奇怪行为
- TypeScript "字符串文字"子集在重载函数中不可分配给完整集
- 将浮点数分配给子集返回 1
- 如何根据R中元素内"A"的字母数将元素分配给不同的子集?
- 子集列表为元素,并在 r 中分配连续的标签
- 将 2D 数组的子集分配给另一个不同大小的数组
- 如何将许多子集分配给其最大的超集
- 多索引panda数据帧子集分配
- r语言 - 如何将数据框"a"的子集分配给数据框"b"的子集
- r语言 - 为 ggplot2 中的子集分配固定颜色
最新更新
- vsto Outlook插件在Outlook 2016和Office 365中的行为不同
- npm install不会在我的React项目中安装任何node模块
- 用两次检查遍历两个列表
- 将图像转换为RGB格式的文本文件,格式为三逗号分隔
- 我正试图找到一种方法将TimeSpan变量转换为秒的整数量
- FCM云消息传递验证令牌
- C多重间接
- 显示数组中元素的倒计时。setInterval 不会导致延迟。最后一个元素立即显示
- sveltekit:等待来自+服务器的数据.t加载函数
- JQuery是:检查每次点击返回两个值
- RxJS中具有共享结果的请求队列
- Beautifulsoup如何添加一些东西到列,如果元素没有显示
- 在Jekyll blog中按2D位置(距离)搜索
- Robocopy在复制过程中向文件名添加日期
- c -间接递归的用例
- 如何将日期对象转换为格式(DD-MM-YYYY)
- 如何从没有使用python硒链接的网站下载文件?
- 用错误处理循环捕获用户输入的最佳方法
- 如何使用内部连接在php发送值从下拉菜单到数据库的两个不同的表
- 我如何得到一个状态的IISreset - true,如果它是启动和false,如果它是停止
- 如何复制列标题"Testing"的列
- 读取文件夹中的多个DOCX文件到多个dataframe时出错
- 无法下载InceptionV3 Keras
- 如何打印数据在模板django的一个不同的表由外键连接?
- 动态导航菜单超时功能未清除
- 如何使用EPPlus 6.1.3将图表系列分配到辅助Y轴?
- 如何使用R来合并冗余信息?
- c# Maui应用程序不使用本地ASP.. NET核心Web API
- 使用 JavaScript 中的日期时间运行行<title>
- r语言 - 如何添加四分位数/IQR到tab_stat_fun?
热门标签:
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium