我有一个这样的文本,并希望仅在<
和/
字符之后消除空白,以避免在解析它时出现错误。
输入:
< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >
输出:
<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />
注意:我不想每次都在>
之前消除空白。就在/
后面这是有效的
</lesson >
但这不是
</ lesson>
Regex我试过,但不能覆盖所有情况:
s*< |/ \s*
https://regex101.com/r/0LuV0O/1
把这个问题看作去掉<
和/
后面的空格。
'< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >'
.replace(/([</])s*/g, '$1')
输出:
<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />
这是一个正则表达式,你可以用它来删除
re.sub(r'(?<=[</])s+', '', html_string)
这个正则表达式使用一个正向向后查找断言来匹配紧接在