我使用MarkLogic Content Pump来摄取XML文档。我想在mlcp摄取过程中使用"-transform模块和-transform命名空间"选项转换这些xml文档。我已经为转换创建了XSLT,并将其加载到ML"模块"数据库中。但是mlcp不接受xslt文件并抛出错误:
命令:
mlcp.sh import
-username $username -password $passwd
-host $host -port $port
-input_file_path $inpath
-input_compressed true
-input_file_type aggregates
-aggregate_record_element $splittag
-aggregate_uri_id $uriid
-aggregate_record_namespace "http://www.fda.gov/cdrh/gudid"
-output_collections $collection
-output_permissions my-app-role,read,my-app-role,update
-output_uri_suffix .xml
-transform_module /marklogic.rest.transform/xml-transform-xsl/assets/transform.xsl
-transform_namespace "http://marklogic.com/rest-api/transform/xml-transform-xsl"
-transform_function transform
下面的错误被抛出错误:
15/09/27 15:34:19 WARN mapreduce.ContentWriter: XDMP-MODNOTTEXT: Module /marklogic.rest.transform/fda-transform-xsl/assets/transform.xsl is not a text document
我想知道mlcp是否接受xslt转换?如果不是,那么还有什么选择呢?
MarkLogic在模块数据库中创建等价的xqy文件。通过调用下面"。xqy"文件,将抛出参数不匹配错误:我认为这是由于错误的返回类型:
xquery version "1.0-ml";
module namespace simple-xsl = "http://marklogic.com/rest-api/transform/simple-xsl";
import module namespace extut = "http://marklogic.com/rest-api/lib/extensions-util"
at "/MarkLogic/rest-api/lib/extensions-util.xqy";
declare namespace xsl = "http://www.w3.org/1999/XSL/Transform";
declare default function namespace "http://www.w3.org/2005/xpath-functions";
declare option xdmp:mapping "false";
declare private variable $transform-uri := "/marklogic.rest.transform/fda-transform-xsl/assets/transform.xsl";
declare function fda-transform-xsl:transform(
$context as map:map,
$params as map:map,
$content as document-node()
) as document-node()?
{
extut:execute-transform($transform-uri,$context,$params,$content)
};
我认为您不能将Content Pump的-transform_module直接指向XSLT。我认为它需要一个xQuery模块(参见https://docs.marklogic.com/guide/ingestion/content-pump#id_82518)。
您应该能够设置这样一个自定义转换xQuery模块,并通过xdmp: XSLT -invoke()在content Pump传入的$content映射上调用XSLT转换(参见http://docs.marklogic.com/xdmp:xslt-invoke)。然后将-transform_module设置为指向自定义传输xQuery模块,而不是直接调用XSL转换。
请注意,如果您使用-input_file_type聚合,就像在您的示例中一样,您的自定义转换将应用于每个$splittag定义的每个片段。因此,传入的$content映射将是您正在分割(和转换)的片段。