是对XML解析器有用的空白子节点

为什么我们必须有空白XML节点的概念?它们给XML解析的炼金术带来了什么好处?

一个简单的例子，Perl的XML::LibXML:

use strict;
use warnings;
use feature 'say';
use XML::LibXML;
my $xml = XML::LibXML->load_xml( string => <<'XMLDOC' );
<alphabet>
 <child name='alpha'/>
 <child name='bravo'/>
 <child name='charlie'/>
 <child name='delta'/>
 <child name='echo'/>
</alphabet>
XMLDOC
my ( $parent ) = $xml->findnodes( '/alphabet' );
my @all_kids  = $parent->childNodes;
my @real_kids = $parent->nonBlankChildNodes;
say 'All kids : ', scalar @all_kids;   # '11'
say 'Real kids : ', scalar @real_kids; # '5' => 6 blank child nodes

令我困惑的是，解析器区分检索所有子节点和仅检索非空白节点。

似乎这些空白节点至少有一个相同的用途。如果能确切地知道这些用途是什么，那将是一件很有趣的事情。

从HTML:

考虑这种情况

<div><b>hello</b><i>world</i></div>

和这个:

<div>
    <b>hello</b>
    <i>world</i>
</div>

在第一个示例中，没有空白节点，呈现引擎不会在helloworld之间放置空格。在第二个示例中，由于文本节点之间有一个空白节点，因此输出结果为helloworld。

您需要知道空白节点的位置，因为一些XML语言会关心它们的位置。

解析器无法区分重要空白节点和非重要空白节点。这完全取决于XML的语义。如果解析器消除了纯空节点，而您正在编写一个应用程序，其中这些节点很重要，那么您将从另一个角度编写这个问题。

相关内容

最新更新

热门标签：