清除两个html标记(嵌套)之间的PHP正则表达式



我需要一个正则表达式来清除两个html标记之间的所有内容。但是标签可以嵌套。

我写了这个

$theHTML = '
     <div class="holder">
        dynamic text 1
        <div class="section"> section text </div>
    </div>
';

$first='<div class="holder">';
$second='<div class="section">';
$replace  = ""; 
$find = preg_replace('#('.preg_quote($first).')(.*)('.preg_quote($second).')#si', '$1'.$replace.'$3', $theHTML);

输出;

     <div class="holder"><div class="section"> section text </div>
    </div>

当我们只有一场比赛时,一切都很好。但这个代码可能会像这个一样被破坏;

$theHTML = '
     <div class="holder">
        dynamic text 1
        <div class="section"> 
            section text 
                 <div class="holder">
                    dynamic text 1
                    <div class="section"> section text </div>
                </div>
        </div>
    </div>
';

输出将为;

     <div class="holder"><div class="section"> section text </div>
                </div>
        </div>
    </div>

正如你所看到的,它删除了第一场比赛中的所有内容。我想要得到什么;

     <div class="holder"><div class="section"> 
            section text 
                 <div class="holder"><div class="section"> section text </div>
                </div>
        </div>
    </div>

所以问题是;我怎样才能做到这一点?

提前非常感谢。

将正则表达式中的(.*)替换为(.*?),这将导致延迟求值,这正是您所需要的

$theHTML = '$theHTML = '<div class="holder">
    dynamic text 1
    <div class="section"> 
        section text 
             <div class="holder">
                dynamic text 1
                <div class="section"> section text </div>
            </div>
    </div>
</div>';
$first='<div class="holder">';
$second='<div class="section">';
$replace  = ""; 
$find = preg_replace('#('.preg_quote($first).')(.*?)('.preg_quote($second).')#si', '$1'.$replace.'$3', $theHTML);
echo $find;

输出

<div class="holder"><div class="section"> 
            section text 
                 <div class="holder"><div class="section"> section text </div>
                </div>
        </div>
    </div>

请注意,此正则表达式只"清理"介于holdersection之间的文本,而不是相反。

最新更新