记事本中的 Unicode 文件



当我在记事本中将文本文件保存为"Unicode"是什么意思? 是 Utf-8、Utf-16 还是 Utf-32?提前谢谢。

在记事本中,就像在Windows软件中一样,"Unicode"作为编码名称意味着UTF-16 Little Endian(UTF-16LE)。(我最初认为它不是真正的 UTF-16,因为记事本++将其识别为 UCS-2 并将内容显示为垃圾,但重新检查 BabelPad,我得出结论,记事本甚至可以正确编码非 BMP 字符。

同样,"Unicode 大端序"表示 UTF-16 大端序。"ANSI"是指系统的原生传统编码,例如西方版本的Windows中的8位windows-1252编码。

所有这些格式都是"Unicode"。但通常Mac和Windows上的编辑器意味着UTF-8,因为它在代码128 IIRC下兼容ASCII。UTF-8 通过使用特殊字符表示比 256(适合 8 位的单个字节)更多的代码,这意味着以下字节也属于同一字符。

如果你在终端中查看输出,比如说用vi,如果你看到每两个字符之间有一个空格,那么你正在查看UTF-16,因为每两个字节组成一个字符。您应该看到的是字符之间没有空格,这是 UTF-8 的指示。

最新更新