我有一个对象类型DataFrame
,其中一些元素是文本,一些是数字。
将列转换为列表时,其中一些元素具有非ascii字符。是否有一种方法可以摆脱字符,如.encode('ascii', 'ignore')
,但对于一个列表?
['Central Parku202c',
'Top of the Rock',
'Statue of Libertyu202c',
'Brooklyn Bridge'
]
您可以使用str
访问器:
df.my_column.str.encode('ascii','ignore').str.decode('ascii').tolist()
如果你想后期处理你的列表,你可以在上面应用encode('ascii', 'ignore')
:
my_list = [
'Central Parku202c',
'Top of the Rock',
'Statue of Libertyu202c',
'Brooklyn Bridge'
]
my_list = [e.encode('ascii', 'ignore').decode("utf-8") for e in my_list]
print(my_list)
输出应为:
['Central Park', 'Top of the Rock', 'Statue of Liberty', 'Brooklyn Bridge']