SINGLE_NCLOB需要一个 UNICODE(宽字符)输入文件



我遵循了以下过程:

  1. 打开记事本并输入一些文本:"Hello World"
  2. 将 ansi 文件另存为:c:\HelloWorld.txt

然后,我运行以下查询:

select * from openrowset(bulk 'C:HelloWorld.txt',single_clob) as test

文本显示在名为:BulkColumn 的列中。

然后我这样做:

  1. 打开记事本并输入一些文本:"Hello World"
  2. 将 unicode 文件另存为:c:\HelloWorld.txt

然后,我运行以下查询:

select * from openrowset(bulk N'C:HelloWorld.txt',single_nclob) as test

我得到的错误是:

SINGLE_NCLOB需要一个 UNICODE(宽字符)输入文件。指定的文件不是 Unicode。

这是为什么呢?

您需要仔细检查如何保存"Unicode"文件。在Windows/.NET/SQL Server中,术语"Unicode"特指"UTF-16 Little Endian (LE)"。在处理 UTF-16 大端序 (BE) 时,它将被称为"Unicode 大端序"或"大端序 Unicode"。UTF-8 始终是 UTF-8。

我在记事本中创建了一个文件,然后转到"另存为"并从"编码"下拉列表中选择"Unicode",它与您正在使用的语句配合得很好:

SELECT *
FROM OPENROWSET(BULK N'C:tempOPENROWSET_BULK_NCLOB-test.txt', SINGLE_NCLOB) AS [Test];

如果我使用任何其他编码重新保存它,我会收到您看到的错误消息。

我还使用Notepad++,并在"编码"菜单中选择了"在UCS-2小端序中编码"。UCS-2 和 UTF-16 对于代码点 U+0000 到 U+FFFF 是相同的,并且记事本++中没有 UTF-16 选项,所以这是最接近的东西。是的,它也奏效了。

因此,不知何故,您实际上并没有将文件保存为"Unicode"。如果您在记事本中选择了"Unicode 大端序",就 Windows 使用该术语的方式而言,这不是"Unicode",即使它是有效的 Unicode 编码。

UTF-8 不被 Windows/.NET/SQL Server 视为"Unicode"。在记事本++上,您应该使用编码"Unicode Big Endian"或"Big Endian Unicode"(UCS - 2 BE)/(UCS - 2 LE)保存

最新更新