XML::LibXML::XPathContext 解析 Google Maps kml 文件失败 - 找不到"when"节点



我无法让Perl使用XML::LibXML读取Google LocationHistory.kml文件。 findnodes()找不到when标签,但会找到gx:coord标签。

如果我修改XML文件以gx:放在when前面,它可以工作。但这不是谷歌通过他们的外卖服务生产的。

我想在不先修改的情况下阅读他们的文件。

输入数据文件 - 来自谷歌的外卖服务

#++++++++++++++++++++++++++++++++++++++++
<?xml version='1.0' encoding='UTF-8'?>
<kml xmlns='http://www.opengis.net/kml/2.2' xmlns:gx='http://www.google.com/kml/ext/2.2'>
<Document>
    <Placemark>
        <open>1</open>
        <gx:Track>
            <altitudeMode>clampToGround</altitudeMode>
            <when>2018-05-17T15:59:24Z</when>
            <gx:coord>-98.0896248 29.997944600000004 258</gx:coord>
            <when>2018-05-17T15:59:24Z</when>
            <gx:coord>-98.0896248 29.997944600000004 258</gx:coord>
            <when>2018-05-17T15:59:23Z</when>
            <gx:coord>-98.0896647 29.9979384 258</gx:coord>
            <when>2018-05-17T15:45:14Z</when>
            <gx:coord>-98.0896772 29.9979363 258</gx:coord>
            <when>2018-05-17T15:40:08Z</when>
            <gx:coord>-98.0892224 29.9977119 262</gx:coord>
        </gx:Track>
    </Placemark>
</Document>
</kml>

我的代码

#++++++++++++++++++++++++++++++++++++++++
sub Test {
my ($infile) = @_;
my ($dom, $xpc, @gnodes, @wnodes);

$dom = XML::LibXML->load_xml(location => $infile);
$xpc = XML::LibXML::XPathContext->new($dom);
$xpc->registerNs('xmlns',    'http://www.opengis.net/kml/2.2');
$xpc->registerNs('xmlns:gx', 'http://www.google.com/kml/ext/2.2');
# should find 5
(@wnodes) = $xpc->findnodes('//when');
print 'XPath: //when      Matched:  ', scalar(@wnodes), "n";;
# should find 5
(@gnodes) = $xpc->findnodes('//gx:coord');
say 'XPath: //gx:coord  Matched:  ', scalar(@gnodes);
};

THE OUTPUT - five <gx:coord> found, but zero <when> nodes found
searching for <gx:when> also produces zero results
#++++++++++++++++++++++++++++++++++++++++
Apple-iMac21:NewProgramLocal user$
XPath: //when      Matched:  0
XPath: //gx:coord  Matched:  5

Apple-iMac21:NewProgramLocal user$ 

XPath 使用的前缀不必与 XML 中使用的前缀匹配。事实上,当在 XML 中使用默认命名空间时(如此处的情况),XPath 需要一个前缀,即使 XML 中没有使用任何前缀。只需选择对您有意义的前缀即可在 XPath 中使用。

另请注意,registerNs只采用前缀,因此不包括xmlns:

所以改变:

$xpc->registerNs('xmlns',    'http://www.opengis.net/kml/2.2');
$xpc->registerNs('xmlns:gx', 'http://www.google.com/kml/ext/2.2');
(@wnodes) = $xpc->findnodes('//when');

自:

$xpc->registerNs('main', 'http://www.opengis.net/kml/2.2');
$xpc->registerNs('gx',   'http://www.google.com/kml/ext/2.2');
(@wnodes) = $xpc->findnodes('//main:when');

产生预期的结果:

XPath: //when      Matched:  5
XPath: //gx:coord  Matched:  5

上面的 bytepusher 的答案有效,第二个答案也是如此。 在"when"标签前面添加"XMLNS:"会产生正确的结果,并与使用其导出功能从 Google 下载的文件保持一致(用于"位置记录")。

我假设 xmlns 充当不需要在 xpath 搜索中指定的默认值,但这是一个糟糕的假设。

感谢您的帮助!

最新更新