我有这个字符串:
irak|"iraq"|"زلزال العراق"|"زلزال ايران"|"هزة ارضية"|"هزة ارضية ايران"|"زلزله"|"زلزله ايران"|"زمين لرزه ايران"|"iran news"|"iran quake"|"earthquake"|"Iran-Iraq border earthquake"
我想要的是删除除了英文字母和数字之外的所有字符。就像上面的字符串一样,结果应该是:
irak|iraq|iran news|iran quake|earthquake|Iran-Iraq border earthquake
这应该使用python中的regex来完成。
这里有一种分两步实现的方法:
s1 = re.sub(r'|[^a-zA-Z]+|', "|", s)
s2 = re.sub(r'"', "", s1)
输出(s2(为:
irak|iraq|iran news|iran quake|earthquake|Iran-Iraq border earthquake