这是我的原始CSV文件输入图片描述
我想让类型列只作为第一个标签。当我使用
dataframe['genre'] = dataframe['genre'].str.extract('^(.+?),')
获取第一个逗号前的字符串但也会去掉不带逗号的列
输入图片描述
我怎样才能让它保留那些没有逗号的?
使用不同的正则表达式:
dataframe['genre'] = dataframe['genre'].str.extract('^([^,]+)')
正则表达式:
^ # match start of line
([^,]+) # capture everything but comma
接近,但是在这种情况下,分割字符串比开发正则表达式更容易,因为它非常简单。你可以这样做。
dataframe['genre'] = dataframe['genre'].str.split(',').str[0]