从字符串中删除特殊和无效字符



我有这个字符串:

irak|"iraq"|"زلزال العراق"|"زلزال ايران"|"هزة ارضية"|"هزة ارضية ايران"|"زلزله"|"زلزله ايران"|"زمين لرزه ايران"|"iran news"|"iran quake"|"earthquake"|"Iran-Iraq border earthquake"

我想要的是删除除了英文字母和数字之外的所有字符。就像上面的字符串一样,结果应该是:

irak|iraq|iran news|iran quake|earthquake|Iran-Iraq border earthquake

这应该使用python中的regex来完成。

这里有一种分两步实现的方法:

s1 = re.sub(r'|[^a-zA-Z]+|', "|", s)
s2 = re.sub(r'"', "", s1)

输出(s2(为:

irak|iraq|iran news|iran quake|earthquake|Iran-Iraq border earthquake

最新更新