在C++中读取 unicode 输入时出现问题



我想从输入中读取一个 Unicode 字符串,我为此使用了宽字符。当我输入 ASCII 字符串时,它工作得很好,但是当我输入西里尔字母时,输入似乎是空的。

#include <cstdio> 
#include <string> 
#include <cwchar> 
int main() { 
        setlocale(LC_ALL, "rus"); 
        wchar_t c[64]; 
        wscanf(L"%ls", c); 
        wprintf(L"%d", wcslen(c)); 
        return 0; 
}
< hello
> 5
< алло
> 0

程序不检查任何返回值。在这种情况下,我会斜视从setlocale返回,因为我很确定调用失败并返回NULL

可以设置的区域设置取决于计算机上实际安装的区域设置。

在 Linux 上,您可以从 /usr/share/i18n/SUPPORTED 获取可能的语言环境列表:

$ grep -i ru /usr/share/i18n/SUPPORTED 
ce_RU UTF-8
cv_RU UTF-8
mhr_RU UTF-8
os_RU UTF-8
ru_RU.UTF-8 UTF-8
ru_RU.KOI8-R KOI8-R
ru_RU ISO-8859-5
ru_RU.CP1251 CP1251
ru_UA.UTF-8 UTF-8
ru_UA KOI8-U
tt_RU UTF-8

您会注意到它不是"rus",而是"ru_RU。UTF-8"。但是,该区域设置是否实际安装在您的计算机上?您可以通过 locale -a 获取已安装语言环境的列表,也可以通过 locale-gen 安装新的语言环境,这需要超级用户权限。

所以

  • 检查您的系统上是否实际安装了所需的语言环境,
  • 为区域设置使用正确的标识符,
  • 检查setlocale是否确实成功。

话虽如此,请注意您在此处使用的是 C 功能。您可能最好使用 C++ locale/<iostream> 而不是 <clocale>/类型不安全<cstdio>

最新更新