UTF-8 和 en_AU 之间的区别.UTF-8



我有一些 UTF-8 文本,它在文本编辑器中仍然显示奇怪(文本编辑器设置了 UTF-8 编码)。我知道例如ISO8859-2是与ascii兼容的一个字节编码,具有特定于领土的128个高值,因此来自该领土的人仍然可以使用一个字节编码来显示不属于ascii的字符,并且不需要使用像UTF-8这样的多字节编码。这有什么目的en_AU en_AU的一部分。UTF-8?难道不是我仍然看到我的文本混乱的原因,即使它是 UTF-8 的吗?我的意思是,使用en_AU时,某些值应该映射到不同的字符?据我了解,UTF-8 是不可能的,但这是文本混乱的最后一件事。

Linux 上的区域设置命令输出

LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=

在 UNIX 系统中,语言环境是磁盘上的文件,它们以特定的编码进行编码。因此,您可能在不同的编码中具有相同的语言环境,例如 en_AU.iso55891en_AU.UTF-8 .这不是 UTF-8 的某种变体,而是此特定语言环境文件的变体。如果您的区域设置使用的是区域设置的 UTF-8 变体,则使用区域设置系统的任何内容都将输出 UTF-8 编码值。

最新更新