我需要一个正则表达式来清除两个html标记之间的所有内容。但是标签可以嵌套。
我写了这个
$theHTML = '
<div class="holder">
dynamic text 1
<div class="section"> section text </div>
</div>
';
$first='<div class="holder">';
$second='<div class="section">';
$replace = "";
$find = preg_replace('#('.preg_quote($first).')(.*)('.preg_quote($second).')#si', '$1'.$replace.'$3', $theHTML);
输出;
<div class="holder"><div class="section"> section text </div>
</div>
当我们只有一场比赛时,一切都很好。但这个代码可能会像这个一样被破坏;
$theHTML = '
<div class="holder">
dynamic text 1
<div class="section">
section text
<div class="holder">
dynamic text 1
<div class="section"> section text </div>
</div>
</div>
</div>
';
输出将为;
<div class="holder"><div class="section"> section text </div>
</div>
</div>
</div>
正如你所看到的,它删除了第一场比赛中的所有内容。我想要得到什么;
<div class="holder"><div class="section">
section text
<div class="holder"><div class="section"> section text </div>
</div>
</div>
</div>
所以问题是;我怎样才能做到这一点?
提前非常感谢。
将正则表达式中的(.*)
替换为(.*?)
,这将导致延迟求值,这正是您所需要的
$theHTML = '$theHTML = '<div class="holder">
dynamic text 1
<div class="section">
section text
<div class="holder">
dynamic text 1
<div class="section"> section text </div>
</div>
</div>
</div>';
$first='<div class="holder">';
$second='<div class="section">';
$replace = "";
$find = preg_replace('#('.preg_quote($first).')(.*?)('.preg_quote($second).')#si', '$1'.$replace.'$3', $theHTML);
echo $find;
输出
<div class="holder"><div class="section">
section text
<div class="holder"><div class="section"> section text </div>
</div>
</div>
</div>
请注意,此正则表达式只"清理"介于holder
到section
之间的文本,而不是相反。