我有一个充满扩展 ASCII 值的std::string
(例如 čáě
(。我需要对这个字符串进行 URL 编码,以便 JavaScript 使用 DecodeURIComponent
进行解码。
我尝试通过windows-1252
代码点将其转换为 UTF-16,然后转换为 UTF-8,但由于没有足够的示例用于MultiByteToWideChar
和WideCharToMultiByte
函数而无法这样做。
我正在Windows 14.0 64位上使用MSVC-10进行编译。
如何至少迭代最终 UTF-8 字符串的各个字节以进行 URL 编码?
谢谢
MultiByteToWideChar
将字符串转换为 UTF-16,然后逐个对字符进行编码。
示例代码:
std::string readData = "Extended ASCII characters (ěščřžýáíé)";
int size = MultiByteToWideChar(
1252, //1252 corresponds with windows-1252 codepoint
0,
readData.c_str(),
-1, //the string is null terminated, no need to pass the length
NULL,
0
);
wchar_t* wchar_cstr = new wchar_t[size];
MultiByteToWideChar(
1252,
0,
readData.c_str(),
-1,
wchar_cstr,
size
);
std::stringstream encodeStream;
for(uint32_t i = 0; i < size; i++){
wchar_t wchar = wchar_cstr[i];
uint16_t val = (uint16_t) wchar;
encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << val;
}
delete[] wchar_cstr;
std::string encodedString = encodeStream.str(); // the URL encoded string
虽然这确实编码了基本的ASCII字符(<128(,但它完全可以通过JavaScript解码,这是最终目标。
我设法用非常简单的代码做到了这一点。下面是将从文件读取的 JSON 转换为 URL 并发送到外部网站以显示 JSON 中的语法错误的示例(在 MS/Windows 上测试(:
void EncodeJsonFileTextAndSendToExternalWebSiteToShowSyntaxErrors (const std::string &jsonTxt)
{
std::stringstream encodeStream;
for (char c : jsonTxt)
{
if (c>='0' && c<='9' || c>='a' && c<='z' || c>='A' && c<='Z' || strchr("{}();",c))
encodeStream << c;
else
encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << (int)c;
}
std::string url = "cmd /c start https://jsonlint.com/?json=" + encodeStream.str();
system(url.c_str());
}
它会自动打开这样的 Web 浏览器:https://jsonlint.com/?json={%0a%22dataset%20name%22%3a%20%22CIHP%22%0alabel%2017%0a}