我想在csv文件上获得逗号之前的第一个字符串,但也获得没有逗号(只有一个标签)的行字符串



这是我的原始CSV文件输入图片描述

我想让类型列只作为第一个标签。当我使用

dataframe['genre'] = dataframe['genre'].str.extract('^(.+?),')

获取第一个逗号前的字符串但也会去掉不带逗号的列

输入图片描述

我怎样才能让它保留那些没有逗号的?

使用不同的正则表达式:

dataframe['genre'] = dataframe['genre'].str.extract('^([^,]+)')

正则表达式:

^       # match start of line
([^,]+) # capture everything but comma

接近,但是在这种情况下,分割字符串比开发正则表达式更容易,因为它非常简单。你可以这样做。

dataframe['genre'] = dataframe['genre'].str.split(',').str[0]

相关内容

最新更新