我正在尝试使用 dom 文档提取特定的 HTML 团块。
我的代码如下:
$domd = new DOMDocument('1.0', 'utf-8');
$domd->loadHTML($string);
$this->hook = 'content';
if($this->hook !== '') {
$main = $domd->getElementById($this->hook);
$newstr = "";
foreach($main->childNodes as $node) {
$newstr .= $domd->saveXML($node, LIBXML_NOEMPTYTAG);
}
$domd->loadHTML($newstr);
}
//MORE PARSING USING THE DOMD OBJECT
它工作得很好,但foreach很慢,我想知道是否有更智能的方法可以做到这一点。我正在将 HTML 重新加载到$domd中,以便我可以继续编辑。在我的脑海里,我觉得我应该保存一个片段,而不是将保存的$newstr重新加载到对象中。
这能变得更优雅或更快吗?
谢谢!
我假设您想更改现有的$domd
文档,将其完全替换为您从该内容节点中获取的子节点:
更新:刚刚意识到,由于您正在使用 loadHTML
重新加载,您可能希望保留它创建的html
/body
节点。下面的代码已调整为空body
并在那里附加片段:
$domd = new DOMDocument('1.0', 'utf-8');
$domd->loadHTML($string);
$this->hook = 'content';
if($this->hook !== '') {
$main = $domd->getElementById($this->hook);
$fragment = $domd->createDocumentFragment();
while($main->hasChildNodes()) {
$fragment->appendChild($main->firstChild);
}
$body = $domd->getElementsByTagName("body")->item(0);
while($body->hasChildNodes()) {
$body->removeChild($body->firstChild);
}
$body->appendChild($fragment);
}
//MORE PARSING USING THE DOMD OBJECT