汉字编码



我有一个用例,我通过post请求向spring控制器提交参数。在控制器中,我正在读取参数并执行一些操作。之后,我将这些参数作为请求参数的一部分发送到其他URL。

在这里我不会处理汉字。它变得一团糟。

我现在正在执行的操作:1) 我将下面的中文文本作为参数传递给HTML页面中的名称主题(这不是JSP)。以下便是有关此问题的所有信息

2) 当我从控制器中的请求中读取此值时,它如下所示:»

3) 我无法获得从页面提交的确切值。

当我在下面的url中验证编码文本时,它看起来已经被编码了:http://coderstoolbox.net/string/#!编码=无&action=编码&charset=utf_8http://www.cafewebmaster.com/online_tools/utf_decode

4) 现在,我想将实际用户提交的字符串作为response.sendRedirect传递到其他URL。我尝试解码URL,看看是否能获得实际字符串,但没有成功。

我正在使用tomcat服务器。我在server.xml中定义了UTF-8编码,并在web.xml中添加了URLEncodingFilter作为第一个过滤器映射。此筛选器将request.setEncoding转换为UTF-8。

但我还是无法追踪哪里出了问题。有人能建议我如何取回控制器中的实际字符串吗?

在我的web.xml 中也有以下过滤器

<filter>
            <filter-name>EncodingFilter</filter-name>
            <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
            <init-param>
                <param-name>encoding</param-name>
                <param-value>UTF-8</param-value>
            </init-param>
            <init-param>
                <param-name>forceEncoding</param-name>
                <param-value>true</param-value>
            </init-param>
        </filter>

如果您需要任何信息来获取更多上下文,请告诉我。

如果您正在使用,请将server.xml文件中的连接器更改为

<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1"
    redirectPort="8443" useBodyEncodingForURI="true">
</Connector>

希望这能解决你的问题。

谨致问候,Kishore

尝试将此筛选器添加到web.xml:

<filter>
    <filter-name>characterEncodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
        <param-name>encoding</param-name>
        <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
        <param-name>forceEncoding</param-name>
        <param-value>true</param-value>
    </init-param>
</filter>

并映射它:

<filter-mapping>
    <filter-name>characterEncodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
</filter-mapping>

我有一个类似的问题,这解决了它。

在完成下面的解码后,我能够检索到实际的字符串。我仍在调查为什么我需要做拉丁语解码。一旦我完全理解了这个问题,我就会更新。如果你们中有人知道拉丁编码的原因,请告诉我。

public String getncodedSubject(String text) {
        if (text == null || text.isEmpty()) {
                return "";
        }
        try {
            byte[] encoding1 = subject.getBytes("UTF-8");
            String string1 = new String(encoding1, 0, encoding1.length); // Default encoding of my platform is UTF-8
            byte[] encoding2 = string1.getBytes("ISO8859-1");//ISO-8859-1 (ISO Latin 1) Character Encoding
            char[] hexaChars =  Hex.encodeHex(encoding2);
            StringBuilder str = new StringBuilder();
            for(int i=0;i<hexaChars.length;i = i+2){
                str.append("%");
                str.append(hexaChars[i]);
                str.append(hexaChars[i+1]);
            }            
            return str.toString();
        } catch (UnsupportedEncodingException e) {
            System.out.println(e);
        }
        return "";
    }

经过更多的挖掘,它似乎得到了拉丁编码的字符串:

import java.nio.charset.CharsetDecoder;  
import java.nio.charset.Charset;
import java.util.Arrays; 
public class Main {
    public static void main(String[] args) throws Exception {
        byte[] encoding1 = "以ä¸ä¾¿æ¯æå³æ­¤é®é¢çææä¿¡æ¯".getBytes("ISO8859-1");
        for (byte b : encoding1) {
            System.out.printf("%x ",b);
        }  
    }
}

我仍然不确定它是如何得到拉丁编码的字符串。。。有什么建议吗?我在server.xml中也检查了

感谢大家的回复。在做了更多的调查之后,以下是我的观察结果。

我使用Mason(Perl+HTML)呈现页面,而不是使用JSP。所以我无法在页面中指定编码类型来强制浏览器提交UTF-8编码的字符串。

现在,我正在用"ISO8859-1"(拉丁语)进行编程解码,并用UTF-8进行编码,以获得实际的字符串供使用。

请告诉我有一种方法可以在Mason(Perl+HTML)中指定编码类型,这样它就可以用UTF-8编码提交参数,而不是采用默认编码。

import java.nio.charset.CharsetDecoder;  
import java.nio.charset.Charset;
import java.util.Arrays; 
public class Main {
    public static void main(String[] args) throws Exception {
        byte[] encoding1 = "ä»¥ä¸‹ä¾¿æ˜¯æœ‰å…³æ­¤é—®é¢˜çš„æ‰€æœ‰ä¿¡æ ¯".getBytes("ISO8859-1");                
        String s = new String(encoding1, "UTF-8");
        System.out.println(s);
    }
}

最新更新