我有一个程序,它与外部http服务器通信,以请求第一个、第二个etc值。。。(1º
,2º
,3º
,4º
,…)
我在c#中有一个º
字符的问题。
以下是一些示例代码:
var testdata=new Dictionary<string,string>{
{"val","º"},
{"val1","xBA"},
{"val2","u00BA"},
};
var content = new FormUrlEncodedContent(testdata);
var cont = content.ReadAsStringAsync().GetAwaiter().GetResult();
结果是:
val=%C2%BA&val1=%C2%BA&val2=%C2%BA
我用curl和firefox控制台测试与服务器的通信结果应该是:
val=%BA&val1=%BA&val2=%BA
不知怎的,C#中额外的%C2
无法与服务器一起工作。
如何正确修复或逃离º
?
此问题与FormUrlEncodedContent
使用的默认编码UTF-8
有关,您的服务器需要ISO-8859-1
。
这里有一个解决方法,但你需要(不幸的是)将System.Web
添加到你的项目中:
// This is an implementation of FormUrlEncodedContent with `ISO-8859-1`
public class FormIso8859Encoder : ByteArrayContent
{
public FormIso8859Encoder(IEnumerable<KeyValuePair<string, string>> nameValueCollection)
: base(FormDataToByteArray(nameValueCollection))
{
Headers.Add("Content-Type", "application/x-www-form-urlencoded");
}
private static byte[] FormDataToByteArray(IEnumerable<KeyValuePair<string, string>> nameValueCollection)
{
StringBuilder sb = new StringBuilder();
foreach (var nameValue in nameValueCollection)
{
if (sb.Length > 0)
sb.Append('&');
sb.Append(nameValue.Key);
sb.Append('=');
// Here is the major change
sb.Append(HttpUtility.UrlEncode(nameValue.Value, Encoding.GetEncoding("iso-8859-1") ));
}
return Encoding.Default.GetBytes(sb.ToString());
}
}
然后
var testdata=new Dictionary<string,string>{
{"val","º"},
{"val1","xBA"},
{"val2","u00BA"},
};
var content = new FormIso8859Encoder(testdata);
var cont = content.ReadAsStringAsync().GetAwaiter().GetResult();
这提供了以下输出:
val=%BA&val1=%BA&val2=%BA
°
的正确unicode字符是u00B0
。更多信息可以在这里找到如何在C#中使用unicode。
所有unicode字符都可以在这里找到。