Pentaho "Get XML Data"步骤有时无法读取相同的xml文件



我正在使用五角壶工具进行 ETL 作业。在作业中,其中一个步骤(获取 XML 数据(有时无法读取/解析 xml 文件。有时相同的XML文件没有抛出任何异常,有时它会抛出。错误列表如下所示 -

  • 1( 文档第 1 行错误 file:///D:/softwares/pdi-ce-6.0.1.0-386/data-integration/UTF-8 : 元素类型"置信度"必须由匹配的结束标记终止 "".
  • 2( org.dom4j.DocumentException: 文档第 -1 行出现错误: 文件过早结束。嵌套异常:文件过早结束。

但是,我在xml文件中没有发现任何问题。任何人都可以在这个话题上提供帮助吗?

我没有找到根本原因,但得到了解决方案。该步骤正在解析的 xml 文件位于 zip 文件中。在解析 xml 文件之前,Java 步骤是解压缩 zip 文件。我没有解压缩 zip 文件,而是直接解析了 zip 中的 xml 文件。这样可以解决问题,并且不会再次报告任何错误。

最新更新