我想从输入中读取一个 Unicode 字符串,我为此使用了宽字符。当我输入 ASCII 字符串时,它工作得很好,但是当我输入西里尔字母时,输入似乎是空的。
#include <cstdio>
#include <string>
#include <cwchar>
int main() {
setlocale(LC_ALL, "rus");
wchar_t c[64];
wscanf(L"%ls", c);
wprintf(L"%d", wcslen(c));
return 0;
}
< hello
> 5
< алло
> 0
程序不检查任何返回值。在这种情况下,我会斜视从setlocale
返回,因为我很确定调用失败并返回NULL
。
可以设置的区域设置取决于计算机上实际安装的区域设置。
在 Linux 上,您可以从 /usr/share/i18n/SUPPORTED
获取可能的语言环境列表:
$ grep -i ru /usr/share/i18n/SUPPORTED
ce_RU UTF-8
cv_RU UTF-8
mhr_RU UTF-8
os_RU UTF-8
ru_RU.UTF-8 UTF-8
ru_RU.KOI8-R KOI8-R
ru_RU ISO-8859-5
ru_RU.CP1251 CP1251
ru_UA.UTF-8 UTF-8
ru_UA KOI8-U
tt_RU UTF-8
您会注意到它不是"rus",而是"ru_RU。UTF-8"。但是,该区域设置是否实际安装在您的计算机上?您可以通过 locale -a
获取已安装语言环境的列表,也可以通过 locale-gen
安装新的语言环境,这需要超级用户权限。
所以
- 检查您的系统上是否实际安装了所需的语言环境,
- 为区域设置使用正确的标识符,
- 检查
setlocale
是否确实成功。
话虽如此,请注意您在此处使用的是 C 功能。您可能最好使用 C++ locale
/<iostream>
而不是 <clocale>
/类型不安全<cstdio>
。