正则表达式删除 HTML 标记中"<"和"/"后面的空格



我有一个这样的文本,并希望仅在</字符之后消除空白,以避免在解析它时出现错误。

输入:

< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >

输出:

<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />

注意:我不想每次都在>之前消除空白。就在/后面这是有效的

</lesson >

但这不是

</ lesson>

Regex我试过,但不能覆盖所有情况:

s*< |/ \s*

https://regex101.com/r/0LuV0O/1

把这个问题看作去掉</后面的空格。

'< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >'
.replace(/([</])s*/g, '$1')

输出:

<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />

这是一个正则表达式,你可以用它来删除

re.sub(r'(?<=[</])s+', '', html_string)

这个正则表达式使用一个正向向后查找断言来匹配紧接在

相关内容

  • 没有找到相关文章

最新更新