RegEx:匹配HTML标签和HTML字符串中的文本



我写了一个匹配所有headerHTML元素的正则表达式,包括它们的文本。我现在使用的正则表达式是:/<(h[1-6])[^>]*>(.*?)</1>/gi.

我想匹配所有标题和文本直到testing-options出现在下面的字符串中:

<h1>jfhfnjkgf</h1><h2>fegsg</h2><h2>fwegrweghrw</h2><h4>sfadfsaf</h4><h4>ukfdsnsjkfsd</h4><ac:structured-macro ac:name="testing-options" ac:schema-version="1" data-layout="default" ac:local-id="8bbfe293-eeb9-4785-9873-9fb9b218692b" ac:macro-id="bed737bbfaaf5f1df5f68a0ecc0bc6a7"><ac:parameter ac:name="enable-testing">disable</ac:parameter></ac:structured-macro><h3>bkbkvwv</h3><h4>vbdkhvbkwv</h4><h3>v n vw bv</h3><p />

提供的最终正则表达式应该匹配的每个标题和文本,直到testing options出现在上面的字符串中。在这种情况下,匹配应该是:<h1>jfhfnjkgf</h1><h2>fegsg</h2><h2>fwegrweghrw</h2><h4>sfadfsaf</h4><h4>ukfdsnsjkfsd</h4>.

使用以下不含global flag的正则表达式

(<h[1-6]>w+</h[1-6]>)*

最新更新