小贝子编程

如何从文件中读取的每一行字符串的开头删除b

我正在阅读一个csv，如下所示。

data = pd.read_csv('news.csv')

它包含news和category作为列。我需要在新闻专栏中标记这些词。问题是，新闻专栏中的每一行文本的开头都包含b。

b'世界各地的病毒长期增加：世界卫生组织'
b'蚊子传播病毒。。。

我试过如何在python中去掉字符串中的b前缀？但这是针对字节编码的字符串。所以，

line = data['news'][0]
line.decode('utf-8')

将导致：

AttributeError: 'str' object has no attribute 'decode'

这些线路中的每一条都属于str类型。如何删除这些b？

此b''可能指向可以解码为字符串''的字节类型，但也可能是内容为b'...'的字符串本身。

对于第一种情况，您需要line.decode()，第二种情况需要line[2:-1]。

相关内容