替换 unicode python 中的多个字符


import re
test = unicode("شدَد", encoding='utf-8')
test = test.replace(u"u064e", "")

这是删除一个字符的代码。我想将以下任何 unicode 字符替换为 0627:0622、0623、0625。这是针对阿拉伯语的。我知道如何在多行中做到这一点,但是有没有办法在一条线上做到这一点?

如果您希望在单行中替换多个字符(Unicode 代码点(,可以使用简单的交替正则表达式:

import re
test = unicode("شدَد", encoding='utf-8')
test = re.sub(u"u064e|u0634", "", test,  flags=re.UNICODE)

或者,使用范围正则表达式:

test = re.sub(u"[u064eu0634]", "", test,  flags=re.UNICODE)

最新更新