我正在使用正则置于p标签的情况下,如果html属性带有p tag,而没有属性,则言论是:
$html = preg_replace("/<p[^>]*>(.+?)</p>/i", "<p>$1</p>", $html);
如果p标签没有任何新行,例如
<p style="text-align: center;">It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout</p>
但是,当p标签有新的线时,则高于正则上方的行不起作用。示例
<p style="text-align: center;">It is a long established fact that a reader will be
distracted by the readable <br />
content of a page when looking at its layou</p>
因此,有人可以建议在上述以上的正则需要哪些更改,以便如果p标签的字符串包括新行,它们可以正常工作?
如果您必须,请使用
$html = preg_replace("/<p[^>]*>(.+?)</p>/is", "<p>$1</p>", $html);
# ^
可以启用singleline
模式,又称点也匹配新线字符。通常警告不使用HTML
标签上的正则表达式。
请参阅Regex101.com上的。
要使用DOM解析器,使用DOMDOCUMENT和loadHTML()
非常容易。
这将加载文档,然后使用getElementsByTagName()
选择所有<p>
标签。然后,对于它找到的每个标签,它检查它是否具有属性并在需要时将其删除...
$doc = new DOMDocument();
$doc->loadHTML($html);
$pTags = $doc->getElementsByTagName("p");
foreach ( $pTags as $p ) {
if ( $p->hasAttributes() ) {
foreach ( $p->attributes as $attribute ) {
$p->removeAttribute($attribute->nodeName );
}
}
}
// Save/echo the resultant HTML
echo $doc->saveHTML();