HTML转义方法未检测到空格



我有这个HTML转义方法:

public static String stringToHTMLString(String string) {
    StringBuffer sb = new StringBuffer(string.length());
    // true if last char was blank
    boolean lastWasBlankChar = false;
    int len = string.length();
    char c;
    for (int i = 0; i < len; i++)
        {
        c = string.charAt(i);
        if (c == ' ') {
            // blank gets extra work,
            // this solves the problem you get if you replace all
            // blanks with &nbsp;, if you do that you loss 
            // word breaking
            if (lastWasBlankChar) { // NOT going into this loop
                lastWasBlankChar = false;
                sb.append("&nbsp;");
                }
            else {
                lastWasBlankChar = true;
                sb.append(' ');
                }
            }
        else {
            lastWasBlankChar = false;
            //
            // HTML Special Chars
            if (c == '"')
                sb.append("&quot;");
            else if (c == '&')
                sb.append("&amp;");
            else if (c == '<')
                sb.append("&lt;");
            else if (c == '>')
                sb.append("&gt;");
            else if (c == 'n')
                // Handle Newline
                sb.append("&lt;br/&gt;");
            else {
                int ci = 0xffff & c;
                if (ci < 160 )
                    // nothing special only 7 Bit
                    sb.append(c);
                else {
                    // Not 7 Bit use the unicode system
                    sb.append("&#");
                    sb.append(new Integer(ci).toString());
                    sb.append(';');
                    }
                }
            }
        }
    return sb.toString();
}

当我用字符串"bo y"传递它时,它返回"bo y"。当我将输入字符串更改为"bo>y"时,它正确地转义了字符串。知道为什么太空逃生不起作用吗?

谢谢。

运行时运行良好,我得到:

stringToHTMLString("This is  a   multi-space      test")
This is &nbsp;a &nbsp; multi-space &nbsp; &nbsp; &nbsp;test

嗯,现在我想起来了,你以为第一个空间会被逃离吗?按照逻辑,它先从一个空格开始,然后交替地从一个不间断空格开始,因为它最初是false。

这并不能回答您的实际问题,但更好的方法是在元素上使用CSS的white-space: pre-wrap;。。。如果你能逃脱支持IE8+的惩罚。否则,对于较旧的IE,您必须使用

white-space: normal !important;
white-space: pre-wrap;
word-wrap: break-word;

您对7位安全字符的定义也是。。。有趣的除非必须支持Windows98,否则最好使用UTF-8,而不是手动转义不寻常的字符,并可能完全删除非格式控制代码。

根据您的评论判断,我相信您想对音乐网站API的URL中使用的字符串进行转义。

我必须建议你利用第三方图书馆。

您可以使用: nbsp java.net.URLEncoder.encode(字符串s,字符串编码)

例如

URLEncoder.encode(searchQuery, "UTF-8");

来源:Java 中的URL查询参数编码

看起来堆栈溢出可能已经溢出了您的第二个字符串
第二个"男孩"假设是"bo&nbsp;y"

最新更新