UTF-8 和 en_AU 之间的区别.UTF-8

我有一些 UTF-8 文本，它在文本编辑器中仍然显示奇怪（文本编辑器设置了 UTF-8 编码）。我知道例如ISO8859-2是与ascii兼容的一个字节编码，具有特定于领土的128个高值，因此来自该领土的人仍然可以使用一个字节编码来显示不属于ascii的字符，并且不需要使用像UTF-8这样的多字节编码。这有什么目的en_AU en_AU的一部分。UTF-8？难道不是我仍然看到我的文本混乱的原因，即使它是 UTF-8 的吗？我的意思是，使用en_AU时，某些值应该映射到不同的字符？据我了解，UTF-8 是不可能的，但这是文本混乱的最后一件事。

Linux 上的区域设置命令输出

LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=

在 UNIX 系统中，语言环境是磁盘上的文件，它们以特定的编码进行编码。因此，您可能在不同的编码中具有相同的语言环境，例如 en_AU.iso55891和en_AU.UTF-8 .这不是 UTF-8 的某种变体，而是此特定语言环境文件的变体。如果您的区域设置使用的是区域设置的 UTF-8 变体，则使用区域设置系统的任何内容都将输出 UTF-8 编码值。

相关内容

最新更新

热门标签：