如何从文件中读取的每一行字符串的开头删除b



我正在阅读一个csv,如下所示。

data = pd.read_csv('news.csv')

它包含newscategory作为列。我需要在新闻专栏中标记这些词。问题是,新闻专栏中的每一行文本的开头都包含b

b'世界各地的病毒长期增加:世界卫生组织'
b'蚊子传播病毒。。。

我试过如何在python中去掉字符串中的b前缀?但这是针对字节编码的字符串。所以,

line = data['news'][0]
line.decode('utf-8')

将导致:

AttributeError: 'str' object has no attribute 'decode'

这些线路中的每一条都属于str类型。如何删除这些b?

b''可能指向可以解码为字符串''的字节类型,但也可能是内容为b'...'的字符串本身。

对于第一种情况,您需要line.decode(),第二种情况需要line[2:-1]

最新更新