HTML标签中的新线路



我正在使用正则置于p标签的情况下,如果html属性带有p tag,而没有属性,则言论是:

$html = preg_replace("/<p[^>]*>(.+?)</p>/i", "<p>$1</p>", $html);

如果p标签没有任何新行,例如

<p style="text-align: center;">It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout</p>

但是,当p标签有新的线时,则高于正则上方的行不起作用。示例

<p style="text-align: center;">It is a long established fact that a reader will be
distracted by the readable <br />
content of a page when looking at its layou</p>

因此,有人可以建议在上述以上的正则需要哪些更改,以便如果p标签的字符串包括新行,它们可以正常工作?

如果您必须,请使用

$html = preg_replace("/<p[^>]*>(.+?)</p>/is", "<p>$1</p>", $html);
#                                          ^

可以启用singleline模式,又称点也匹配新线字符。通常警告不使用HTML标签上的正则表达式。
请参阅Regex101.com上的

要使用DOM解析器,使用DOMDOCUMENT和loadHTML()非常容易。

这将加载文档,然后使用getElementsByTagName()选择所有<p>标签。然后,对于它找到的每个标签,它检查它是否具有属性并在需要时将其删除...

$doc = new DOMDocument();
$doc->loadHTML($html);
$pTags = $doc->getElementsByTagName("p");
foreach ( $pTags as $p )    {
    if ( $p->hasAttributes() )  {
        foreach ( $p->attributes as $attribute )    {
            $p->removeAttribute($attribute->nodeName );
        }
    }
}
// Save/echo the resultant HTML
echo $doc->saveHTML();

最新更新