如何从所有表/列中删除所有换行符



我正在努力将数据库从SQL Server导出到Snowflake,我遇到了一个问题,即我们有未知数量的列具有用户注释并包含换行符。问题是数据库有超过 280 个表,我不想手动浏览每个表。我想知道是否有办法自动化。

我目前正在使用 SSIS 导出数据,并且只是对我发现具有换行符的列进行选择替换。

我也用过这个脚本:

declare @NewLine char(2) set @NewLine=char(13)+char(10) update Projects set [PR_ITComment] =Replace([PR_ITComment] , @NewLine,'') WHERE [PR_ITComment] like '%' +@NewLine +'%'

这是解决这个问题的一种方法。这利用了动态 sql,因此您不必求助于循环。您可能需要对此进行一些调整以满足您的需求。您可以添加另一个谓词来阻止列表中的某些表或此类内容。其工作方式是创建相当多的更新语句。然后你只需执行巨大的字符串。

declare @SQL nvarchar(max) = ''
select @SQL = @SQL + 'Update ' + quotename(t.name) + ' set ' + quotename(c.name) + ' = replace(Replace(' + quotename(c.name) + ', char(10), ''''), char(13), '''');' 
from sys.tables t
join sys.columns c on c.object_id = t.object_id
join sys.systypes st on st.xtype = c.system_type_id
where st.name in ('text', 'ntext', 'varchar', 'nvarchar', 'char', 'nchar')
select @SQL
--Once you are comfortable with the output you can uncomment the line below to actually run this.
--exec sp_executesql @SQL

这与 Sean Lange 的答案类似,但它解析为每个表一个更新,而不是每列一个更新。

--declare @schema nvarchar(256) = 'dbo';
--declare @table  nvarchar(256) = 'table';
declare @sql    nvarchar(max) = '';
  set @sql += (select 'update '+t.table_schema+'.'+t.table_name+' set ' +stuff(
    ( select ', ['+i.column_name +']=replace(replace(['+i.column_name+'],char(10),''''),char(13),'''')'+char(10) 
        from information_schema.columns i 
        where i.table_schema=t.table_schema 
          and i.table_name=t.table_name 
          and i.data_type in ('char','nchar','varchar','nvarchar','text','ntext') 
        order by i.ordinal_position 
        for xml path('')),1,1,'')+';'+char(10)
    from information_schema.tables t
    where t.table_type='base table' 
      --and t.table_schema = @schema
      --and t.table_name   = @table
    for xml path (''), type).value('.','varchar(max)')
  --print @sql
  select @sql
  --exec sp_executesql @sql

如果您能够使用引号导出数据(这是标准的CSV方式),Snowflake可以简单地使用新行加载数据。您也可以使用转义,但引用更好。

包含 3 行的示例文件

$ cat data.csv
1,"a",b
2,c,"d1
d2"
3,"e1,e2,
e3",f

示例 SQL 和输出:

create or replace table x(nr int, a string, b string);
put file://data.csv @%x;
copy into x file_format = (field_optionally_enclosed_by = '"');
select * from x;
----+--------+----+
 NR |   A    | B  |
----+--------+----+
 1  | a      | b  |
 2  | c      | d1 |
    |        | d2 |
 3  | e1,e2, | f  |
    | e3     |    |
----+--------+----+
我在

将数据导出到 excel 时遇到了同样的问题。您可以使用 '' 替换字符 (13) 和字符 (10)。那会起作用。

它只是简单地替换在"Execure SQL"任务查询或 SSIS 的 SP 中。或者,您可以在更新语句中使用它来永久更新记录。

相关内容

  • 没有找到相关文章

最新更新