import re
test = unicode("شدَد", encoding='utf-8')
test = test.replace(u"u064e", "")
这是删除一个字符的代码。我想将以下任何 unicode 字符替换为 0627:0622、0623、0625。这是针对阿拉伯语的。我知道如何在多行中做到这一点,但是有没有办法在一条线上做到这一点?
如果您希望在单行中替换多个字符(Unicode 代码点(,可以使用简单的交替正则表达式:
import re
test = unicode("شدَد", encoding='utf-8')
test = re.sub(u"u064e|u0634", "", test, flags=re.UNICODE)
或者,使用范围正则表达式:
test = re.sub(u"[u064eu0634]", "", test, flags=re.UNICODE)