删除未知的特殊字符



删除特殊字符

 s="____Ç_apple___   _______new A_____"
 print(re.sub('[^0-9a-zA-Z]s+$', '', s))

结果 = ____Ç_______________apple___ _______new A_____

 s="____Ç_apple___   _______new A_____"
 print(re.sub('[^0-9a-zA-Z]', '', s))

结果 = 苹果新A

最后结果 = 苹果新 A

但我无法理解

我想删除 Ç 和 _ 并保留空格和英语

由于您要将多个空格合并为一个空格,然后删除不是单词或空格的字符,因此您应该在两个单独的正则表达式替换中执行此操作:

print(re.sub(r'[^0-9a-zA-Z ]+', '', re.sub(r's+', ' ', s)))

这输出:

apple new A

你想要"苹果新A"作为结果,对吧?

s="____Ç_apple___   _______new A_____"
result = re.sub('[^a-zA-Z|s]+', '', s)  # apple   new A
result = ' '.join(result.split())  # apple new A
print(result)

最新更新