如何从列表中删除非ascii字符



我有一个对象类型DataFrame,其中一些元素是文本,一些是数字。

将列转换为列表时,其中一些元素具有非ascii字符。是否有一种方法可以摆脱字符,如.encode('ascii', 'ignore'),但对于一个列表?

下面是我得到的列表:
['Central Parku202c',
'Top of the Rock',
'Statue of Libertyu202c',
'Brooklyn Bridge'
]

您可以使用str访问器:

df.my_column.str.encode('ascii','ignore').str.decode('ascii').tolist()

如果你想后期处理你的列表,你可以在上面应用encode('ascii', 'ignore'):

my_list = [
'Central Parku202c',
'Top of the Rock',
'Statue of Libertyu202c',
'Brooklyn Bridge'
]
my_list = [e.encode('ascii', 'ignore').decode("utf-8") for e in my_list]
print(my_list)

输出应为:

['Central Park', 'Top of the Rock', 'Statue of Liberty', 'Brooklyn Bridge']

最新更新