删除特殊字符
s="____Ç_apple___ _______new A_____"
print(re.sub('[^0-9a-zA-Z]s+$', '', s))
结果 = ____Ç_______________apple___ _______new A_____
s="____Ç_apple___ _______new A_____"
print(re.sub('[^0-9a-zA-Z]', '', s))
结果 = 苹果新A
最后结果 = 苹果新 A
但我无法理解
我想删除 Ç 和 _ 并保留空格和英语
由于您要将多个空格合并为一个空格,然后删除不是单词或空格的字符,因此您应该在两个单独的正则表达式替换中执行此操作:
print(re.sub(r'[^0-9a-zA-Z ]+', '', re.sub(r's+', ' ', s)))
这输出:
apple new A
你想要"苹果新A"作为结果,对吧?
s="____Ç_apple___ _______new A_____"
result = re.sub('[^a-zA-Z|s]+', '', s) # apple new A
result = ' '.join(result.split()) # apple new A
print(result)