Marklogic内容泵和XSLT转换



我使用MarkLogic Content Pump来摄取XML文档。我想在mlcp摄取过程中使用"-transform模块和-transform命名空间"选项转换这些xml文档。我已经为转换创建了XSLT,并将其加载到ML"模块"数据库中。但是mlcp不接受xslt文件并抛出错误:

命令:

    mlcp.sh import 
-username $username -password $passwd 
-host $host -port $port 
-input_file_path $inpath 
-input_compressed true 
-input_file_type aggregates 
-aggregate_record_element $splittag 
-aggregate_uri_id $uriid 
-aggregate_record_namespace "http://www.fda.gov/cdrh/gudid" 
-output_collections $collection 
-output_permissions my-app-role,read,my-app-role,update 
-output_uri_suffix .xml 
-transform_module /marklogic.rest.transform/xml-transform-xsl/assets/transform.xsl 
-transform_namespace "http://marklogic.com/rest-api/transform/xml-transform-xsl" 
-transform_function transform

下面的错误被抛出错误:

15/09/27 15:34:19 WARN mapreduce.ContentWriter: XDMP-MODNOTTEXT: Module /marklogic.rest.transform/fda-transform-xsl/assets/transform.xsl is not a text document

我想知道mlcp是否接受xslt转换?如果不是,那么还有什么选择呢?

MarkLogic在模块数据库中创建等价的xqy文件。通过调用下面"。xqy"文件,将抛出参数不匹配错误:我认为这是由于错误的返回类型:

xquery version "1.0-ml";
module namespace simple-xsl = "http://marklogic.com/rest-api/transform/simple-xsl";
import module namespace extut = "http://marklogic.com/rest-api/lib/extensions-util"
    at "/MarkLogic/rest-api/lib/extensions-util.xqy";
declare namespace xsl = "http://www.w3.org/1999/XSL/Transform";
declare default function namespace "http://www.w3.org/2005/xpath-functions";
declare option xdmp:mapping "false";
declare private variable $transform-uri := "/marklogic.rest.transform/fda-transform-xsl/assets/transform.xsl";
declare function fda-transform-xsl:transform(
    $context as map:map,
    $params  as map:map,
    $content as document-node()  
) as document-node()?
{
    extut:execute-transform($transform-uri,$context,$params,$content)
};

我认为您不能将Content Pump的-transform_module直接指向XSLT。我认为它需要一个xQuery模块(参见https://docs.marklogic.com/guide/ingestion/content-pump#id_82518)。

您应该能够设置这样一个自定义转换xQuery模块,并通过xdmp: XSLT -invoke()在content Pump传入的$content映射上调用XSLT转换(参见http://docs.marklogic.com/xdmp:xslt-invoke)。然后将-transform_module设置为指向自定义传输xQuery模块,而不是直接调用XSL转换。

请注意,如果您使用-input_file_type聚合,就像在您的示例中一样,您的自定义转换将应用于每个$splittag定义的每个片段。因此,传入的$content映射将是您正在分割(和转换)的片段。

相关内容

  • 没有找到相关文章

最新更新