汉字编码

我有一个用例，我通过post请求向spring控制器提交参数。在控制器中，我正在读取参数并执行一些操作。之后，我将这些参数作为请求参数的一部分发送到其他URL。

在这里我不会处理汉字。它变得一团糟。

我现在正在执行的操作：1）我将下面的中文文本作为参数传递给HTML页面中的名称主题（这不是JSP）。以下便是有关此问题的所有信息

2）当我从控制器中的请求中读取此值时，它如下所示：»

3）我无法获得从页面提交的确切值。

当我在下面的url中验证编码文本时，它看起来已经被编码了：http://coderstoolbox.net/string/#！编码=无&action=编码&charset=utf_8http://www.cafewebmaster.com/online_tools/utf_decode

4）现在，我想将实际用户提交的字符串作为response.sendRedirect传递到其他URL。我尝试解码URL，看看是否能获得实际字符串，但没有成功。

我正在使用tomcat服务器。我在server.xml中定义了UTF-8编码，并在web.xml中添加了URLEncodingFilter作为第一个过滤器映射。此筛选器将request.setEncoding转换为UTF-8。

但我还是无法追踪哪里出了问题。有人能建议我如何取回控制器中的实际字符串吗？

在我的web.xml 中也有以下过滤器

<filter>
            <filter-name>EncodingFilter</filter-name>
            <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
            <init-param>
                <param-name>encoding</param-name>
                <param-value>UTF-8</param-value>
            </init-param>
            <init-param>
                <param-name>forceEncoding</param-name>
                <param-value>true</param-value>
            </init-param>
        </filter>

如果您需要任何信息来获取更多上下文，请告诉我。

如果您正在使用，请将server.xml文件中的连接器更改为

<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1"
    redirectPort="8443" useBodyEncodingForURI="true">
</Connector>

希望这能解决你的问题。

谨致问候，Kishore

尝试将此筛选器添加到web.xml:

<filter>
    <filter-name>characterEncodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
        <param-name>encoding</param-name>
        <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
        <param-name>forceEncoding</param-name>
        <param-value>true</param-value>
    </init-param>
</filter>

并映射它：

<filter-mapping>
    <filter-name>characterEncodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
</filter-mapping>

我有一个类似的问题，这解决了它。

在完成下面的解码后，我能够检索到实际的字符串。我仍在调查为什么我需要做拉丁语解码。一旦我完全理解了这个问题，我就会更新。如果你们中有人知道拉丁编码的原因，请告诉我。

public String getncodedSubject(String text) {
        if (text == null || text.isEmpty()) {
                return "";
        }
        try {
            byte[] encoding1 = subject.getBytes("UTF-8");
            String string1 = new String(encoding1, 0, encoding1.length); // Default encoding of my platform is UTF-8
            byte[] encoding2 = string1.getBytes("ISO8859-1");//ISO-8859-1 (ISO Latin 1) Character Encoding
            char[] hexaChars =  Hex.encodeHex(encoding2);
            StringBuilder str = new StringBuilder();
            for(int i=0;i<hexaChars.length;i = i+2){
                str.append("%");
                str.append(hexaChars[i]);
                str.append(hexaChars[i+1]);
            }            
            return str.toString();
        } catch (UnsupportedEncodingException e) {
            System.out.println(e);
        }
        return "";
    }

经过更多的挖掘，它似乎得到了拉丁编码的字符串：

import java.nio.charset.CharsetDecoder;  
import java.nio.charset.Charset;
import java.util.Arrays; 
public class Main {
    public static void main(String[] args) throws Exception {
        byte[] encoding1 = "ä»¥ä¸ä¾¿æ¯æå³æ¤é®é¢çææä¿¡æ¯".getBytes("ISO8859-1");
        for (byte b : encoding1) {
            System.out.printf("%x ",b);
        }  
    }
}

我仍然不确定它是如何得到拉丁编码的字符串。。。有什么建议吗？我在server.xml中也检查了

感谢大家的回复。在做了更多的调查之后，以下是我的观察结果。

我使用Mason（Perl+HTML）呈现页面，而不是使用JSP。所以我无法在页面中指定编码类型来强制浏览器提交UTF-8编码的字符串。

现在，我正在用"ISO8859-1"（拉丁语）进行编程解码，并用UTF-8进行编码，以获得实际的字符串供使用。

请告诉我有一种方法可以在Mason（Perl+HTML）中指定编码类型，这样它就可以用UTF-8编码提交参数，而不是采用默认编码。

import java.nio.charset.CharsetDecoder;  
import java.nio.charset.Charset;
import java.util.Arrays; 
public class Main {
    public static void main(String[] args) throws Exception {
        byte[] encoding1 = "ä»¥ä¸‹ä¾¿æ˜¯æœ‰å…³æ¤é—®é¢˜çš„æ‰€æœ‰ä¿¡æ ¯".getBytes("ISO8859-1");                
        String s = new String(encoding1, "UTF-8");
        System.out.println(s);
    }
}

相关内容

最新更新

热门标签：