为什么我们必须有空白XML节点的概念?它们给XML解析的炼金术带来了什么好处?
一个简单的例子,Perl的XML::LibXML
:
use strict;
use warnings;
use feature 'say';
use XML::LibXML;
my $xml = XML::LibXML->load_xml( string => <<'XMLDOC' );
<alphabet>
<child name='alpha'/>
<child name='bravo'/>
<child name='charlie'/>
<child name='delta'/>
<child name='echo'/>
</alphabet>
XMLDOC
my ( $parent ) = $xml->findnodes( '/alphabet' );
my @all_kids = $parent->childNodes;
my @real_kids = $parent->nonBlankChildNodes;
say 'All kids : ', scalar @all_kids; # '11'
say 'Real kids : ', scalar @real_kids; # '5' => 6 blank child nodes
令我困惑的是,解析器区分检索所有子节点和仅检索非空白节点。
似乎这些空白节点至少有一个相同的用途。如果能确切地知道这些用途是什么,那将是一件很有趣的事情。
从HTML:
考虑这种情况<div><b>hello</b><i>world</i></div>
和这个:
<div>
<b>hello</b>
<i>world</i>
</div>
在第一个示例中,没有空白节点,呈现引擎不会在helloworld之间放置空格。在第二个示例中,由于文本节点之间有一个空白节点,因此输出结果为helloworld。
您需要知道空白节点的位置,因为一些XML语言会关心它们的位置。
解析器无法区分重要空白节点和非重要空白节点。这完全取决于XML的语义。如果解析器消除了纯空节点,而您正在编写一个应用程序,其中这些节点很重要,那么您将从另一个角度编写这个问题。