如何在SQL Server导入导出向导中从XML文件导入



我将一个表的数据和模式作为一个XML文件。如何使用SQL Server导入导出向导导入该文件?

我应该使用"平面文件源"作为我的数据源吗?还是别的什么?

[对于信息,我从VistaDB导出了XML,但我还没有达到创建数据的系统可能是一个问题的程度。]

据我所知,您不能通过使用导入导出向导来做到这一点。假设您希望数据以所有关系而不是XML数据类型结束,则需要创建表并使用sp_xml_preparedocument和OPENXML。

参见如何使用OPENXML加载XML数据到现有的SQL表?

据我所知,MS SQL Server Management Studio没有将XML上传到表的工具。有一个选项涉及OPENROWSET和XML处理的组合,但它要求文件驻留在服务器的文件系统中。

我需要将Java web应用程序生成的一系列日志文件加载到一个表中,但无法将它们上传到服务器,我的本地机器上有日志。我设法在两步过程中上传数据,这不是太麻烦,但对于永久解决方案来说,它绝对太慢了。

我创建了一个由两列组成的表:一个自动数字主键和一个varchar(最大)。我使用导入数据将文本文件上传到表中,以便文件中的每一行都是表中的一条记录。主键恰好表示行号。所以我可以这样写:

select LineNumber, TextLine from [LogFile] order by LineNumber
然后,我准备了另一个表,其结构与XML中的记录相匹配。我的XML文件的特点是,每个"值"标记都在自己的文本行中,开始和结束的"记录"标记各在单独的行中。 例如:

    <log>
    <record>
      <date>2018-07-27T09:54:20</date>
      <millis>1532706860250</millis>
      <sequence>13587</sequence>
      <logger>registroweb.ServReg</logger>
      <level>INFO</level>
      <class>somepackage.someclass</class>
      <method>methodname</method>
      <thread>11153</thread>
      <message>some very long text</message>
      <param>another long text</param>
    </record>
   ...
   </log>

这意味着我可以选择所有的记录,其中text_line = ''会给我所有的开始记录标签,但最重要的是,自连接表与t2。Line_number = t1。Line_number + 1总是会给出包含日期标签的行,Line_number +2会给出millis,以此类推。

因此,通过以下查询,我能够将平面线性表转换为适当的表:

insert into LogFileProcessed(
    [date],
    [millis],
    [sequence],
    [logger] ,
    [level]  ,
    [class]  ,
    [method] ,
    [thread] ,
    [message],
    [param]
)
select
    --record.TextLine, 
    convert(datetime, replace(replace(ltrim(dte.TextLine), '<date>',     ''), '</date>',     ''), 126) [date],
    convert(bigint,   replace(replace(ltrim(mls.TextLine), '<millis>',   ''), '</millis>',   '')) [millis],
    convert(bigint,   replace(replace(ltrim(seq.TextLine), '<sequence>', ''), '</sequence>', '')) [sequence],
    replace(replace(ltrim(logr.TextLine),   '<logger>',   ''), '</logger>',   '') [logger],
    replace(replace(ltrim(lvl.TextLine),    '<level>',    ''), '</level>',    '') [level],
    replace(replace(ltrim(cls.TextLine),    '<class>',    ''), '</class>',    '') [class],
    replace(replace(ltrim(mtd.TextLine),    '<method>',   ''), '</method>',   '') [method],
    replace(replace(ltrim(trd.TextLine),    '<thread>',   ''), '</thread>',   '') [thread],
    replace(replace(ltrim(msg.TextLine),    '<message>',  ''), '</message>',  '') [message],
    replace(replace(ltrim(prm.TextLine),    '<param>',    ''), '</param>',    '') [param]  
from LogFile record
left join LogFile dte    on dte.LineNumber    = record.LineNumber+1
left join LogFile mls    on mls.LineNumber    = record.LineNumber+2
left join LogFile seq    on seq.LineNumber    = record.LineNumber+3
left join LogFile logr   on logr.LineNumber   = record.LineNumber+4
left join LogFile lvl    on lvl.LineNumber    = record.LineNumber+5
left join LogFile cls    on cls.LineNumber    = record.LineNumber+6
left join LogFile mtd    on mtd.LineNumber    = record.LineNumber+7
left join LogFile trd    on trd.LineNumber    = record.LineNumber+8
left join LogFile msg    on msg.LineNumber    = record.LineNumber+9
left join LogFile prm    on prm.LineNumber    = record.LineNumber+10 and prm.TextLine <> '</record>' -- param is actually the only tag that is optional and some times is not present in the record.
where record.TextLine = '<record>'
order by 1, 2

考虑到我当时的特殊限制和文件的结构,这对于一次性任务来说已经足够好了,允许我对数据执行常规查询,而不必重复运行XML解析或处理代码。

相关内容

  • 没有找到相关文章

最新更新