我正在尝试找到一个常规EXP,使我能够替换所有的断路和选项卡( n, r, t等),以及之前的任何空格,在一个空间之后和之间。例如,字符串
版权 保留。'
应该变成
'版权所有©2019 Apple Inc.保留所有权利。'
另外,如果原始字符串为:
'版权所有© n t t t t n t t t t2019 n n t t t苹果公司 保留。'
最终结果应该相同。
对于单个线路,在没有其他空间的最简单情况下,它会像
re.sub(r"n", " ", html)
,但是由于我不经常处理正则表达式,所以我不知道如何解决自己的追求。
尝试使用 s,它与所有空格字符匹配。
>>> import re
>>> s = 'Copyright ©ntttnttt2019ntttApple Inc. All rights reserved.'
>>> s = re.sub("s+", " ", s)
>>> s
'Copyright © 2019 Apple Inc. All rights reserved.'