FormUrlEncode 返回编码 º(男性序号指示符)的意外结果



我有一个程序,它与外部http服务器通信,以请求第一个、第二个etc值。。。(,…)

我在c#中有一个º字符的问题。

以下是一些示例代码:

var testdata=new Dictionary<string,string>{
    {"val","º"},
    {"val1","xBA"},
    {"val2","u00BA"},
};
var content = new FormUrlEncodedContent(testdata);
var cont = content.ReadAsStringAsync().GetAwaiter().GetResult();

结果是:

val=%C2%BA&val1=%C2%BA&val2=%C2%BA

我用curl和firefox控制台测试与服务器的通信结果应该是:

val=%BA&val1=%BA&val2=%BA

不知怎的,C#中额外的%C2无法与服务器一起工作。

如何正确修复或逃离º

此问题与FormUrlEncodedContent使用的默认编码UTF-8有关,您的服务器需要ISO-8859-1

这里有一个解决方法,但你需要(不幸的是)将System.Web添加到你的项目中:

// This is an implementation of FormUrlEncodedContent with `ISO-8859-1`
public class FormIso8859Encoder : ByteArrayContent
{
    public FormIso8859Encoder(IEnumerable<KeyValuePair<string, string>> nameValueCollection) 
         : base(FormDataToByteArray(nameValueCollection))
    {
         Headers.Add("Content-Type", "application/x-www-form-urlencoded");  
    }
    private static byte[] FormDataToByteArray(IEnumerable<KeyValuePair<string, string>> nameValueCollection)
    {
        StringBuilder sb = new StringBuilder();
        foreach (var nameValue in nameValueCollection)
        {
            if (sb.Length > 0)
                sb.Append('&');
            sb.Append(nameValue.Key);
            sb.Append('=');
            // Here is the major change
            sb.Append(HttpUtility.UrlEncode(nameValue.Value, Encoding.GetEncoding("iso-8859-1") ));
        }
        return Encoding.Default.GetBytes(sb.ToString());
    }
}

然后

var testdata=new Dictionary<string,string>{
    {"val","º"},
    {"val1","xBA"},
    {"val2","u00BA"},
};
var content = new FormIso8859Encoder(testdata);
var cont = content.ReadAsStringAsync().GetAwaiter().GetResult();

这提供了以下输出:

val=%BA&val1=%BA&val2=%BA

°的正确unicode字符是u00B0。更多信息可以在这里找到如何在C#中使用unicode。

所有unicode字符都可以在这里找到。

相关内容

  • 没有找到相关文章

最新更新