小贝子编程

从分类列的文本中切片数值

本文关键字：切片文本分类 pandas dataframe
更新时间 : 2023-09-20
英文 : Slicing numeric value from a categorical column's text

我正在处理一个数据帧，其中一列如下：

Rating
4.8 out of 5 stars
4.0 out of 5 stars
4.5 out of 5 stars

我想把这些数据切片，只保留第一个数字，例如

Rating
4.8
4.0
4.5

我该怎么解决？

要从字符串(或分类(列的文本中提取字段，请使用pandasSeries.str.extract和regex:

df['Rating'].str.extract('([1-5].[0-9])')
0
0  4.8
1  4.0
2  4.5
df = pd.DataFrame({'Rating': ['4.8 out of 5 stars', '4.0 out of 5 stars', '4.5 out of 5 stars']}, dtype='category')

如果需要，您可以调整正则表达式，请参阅手册页。它假设所有评级都是小数(而不是整数(，并且有一个小数点。

最新更新

查找哈希的最小值和最大值
使用group by函数根据现有列获取二进制列的SQL查询
将Laravel关系对象上的字符串转换为整数
如何用新的hhk测试签名迷你过滤器驱动程序
JS选择插入后的元素
根据唯一值合并数据帧
在Python 3.x中写入压缩CSV文件时出错
如何在其他2列数据的条件下生成一列数据的折线图
Ruby:我有一个hash，键=str.split(//)，值=这些字符的索引.如果存在超过1个字符，如何将多个索引添加
如何检查一个字符串是否包含在Swift字符串数组中的子字符串?
动态地在MAUI网格中创建数据绑定
ModelMapper 2.4.4和Groovy 3.0兼容性问题
Groupby and Sum函数，显示未分组项的索引和和
如何加快django加载时间?
如何在mysql的游标循环中只发生一次插入
如何在.htaccess中替换空白(%20)到分数(_)?(基于php)
显示处于不工作状态的集合中的随机项
Typescript:用一个初始值开始一个reduce语句?
ThinkingSphinx 实时索引和 Rspec 验收测试 w Chrome 无头
无法在Azure DevOps发布管道中提取.net单文件应用程序
Javascript-优化算法(复杂数据结构)
BigTable ReadModifyWriteRow支持映射功能
如何在没有全局URL和变量的情况下加载angular中的外部脚本
循环在第一次迭代后停止
如何在.net核心后台服务ExecuteAsync中只启动一次进程
R/Shiny App将Plot写入RStudio中的Plot视图，而不是Shiny UI
如何正确缓存webaudio对象?
Regex避免{{和}}之间的所有单词
试图访问文件抛出ENOENT:谷歌云应用程序引擎
根据密码中的数字和字符更新状态

从分类列的文本中切片数值

相关内容

最新更新

热门标签：