Dom 文档 - 提取文档 ID 并保存 - Dom Document - extract a document id & save 小贝子编程网

我正在尝试使用 dom 文档提取特定的 HTML 团块。

我的代码如下：

    $domd = new DOMDocument('1.0', 'utf-8');
    $domd->loadHTML($string);
    $this->hook = 'content';
    if($this->hook !== '') {
        $main = $domd->getElementById($this->hook);
        $newstr = "";
        foreach($main->childNodes as $node) {
            $newstr .= $domd->saveXML($node, LIBXML_NOEMPTYTAG);
        }
        $domd->loadHTML($newstr);
    }
    //MORE PARSING USING THE DOMD OBJECT

它工作得很好，但foreach很慢，我想知道是否有更智能的方法可以做到这一点。我正在将 HTML 重新加载到$domd中，以便我可以继续编辑。在我的脑海里，我觉得我应该保存一个片段，而不是将保存的$newstr重新加载到对象中。

这能变得更优雅或更快吗？

谢谢！

我假设您想更改现有的$domd文档，将其完全替换为您从该内容节点中获取的子节点：

更新：刚刚意识到，由于您正在使用 loadHTML 重新加载，您可能希望保留它创建的html/body节点。下面的代码已调整为空body并在那里附加片段：

$domd = new DOMDocument('1.0', 'utf-8');
$domd->loadHTML($string);
$this->hook = 'content';
if($this->hook !== '') {
    $main = $domd->getElementById($this->hook);
    $fragment = $domd->createDocumentFragment();
    while($main->hasChildNodes()) {
        $fragment->appendChild($main->firstChild);
    }
    $body = $domd->getElementsByTagName("body")->item(0);
    while($body->hasChildNodes()) {
        $body->removeChild($body->firstChild);
    }
    $body->appendChild($fragment);
}
//MORE PARSING USING THE DOMD OBJECT

Dom 文档 - 提取文档 ID 并保存

相关内容

最新更新

热门标签：