将非拉丁文本转换为ASCII条目-无需指定区域设置



我正在做一个需要翻译成40多种语言的项目。

我已经把大部分东西都整理好了,但这一件真的让我很烦恼。请看一下这个,看看我需要什么:

<script type="text/javascript">
/* Purpose: Converts all non-latin based characters to their ASCII entity value
 * Usage: [String].encode()
 * Arguments: none
 * Returns: String
 */
String.prototype.encode = function() {
        return this.replace(/([^x01-x7E])/g, function(s) { return         "&#"+s.charCodeAt(0)+";"; });
};
/**
 * Converts all ASCII entity value characters into their unicode equivelant
 * @return (String)
 */
String.prototype.decode = function() {
        Number.prototype.toHex = function(pad) {
            var s = this.toString(16).toUpperCase();
            var v = "";
            if(typeof pad == "number") {
                    while(v.length + s.length < pad) {
                            v += "0";
                    }
            }
            return v + s;
    };
    return this.replace(/(&#([^;]*);)/g, function(s) { return unescape("%u"+        Number(RegExp.$2).toHex(4)); });
};
function translate() {
document.getElementById("txtOutput").value =         document.getElementById("txtInput").value.encode();
}
</script>
<div class="admin_block">
<h1>Translator</h1>
<p>Sometimes you need to add non latin Characters to the templates, php code and more. This tool will help you convert your text</p>
<h2>Type or paste non latin text in here</h2>
<form name="input" onmousemove="translate();">
    <textarea style="width: 900px" id="txtInput" onkeyup="translate();" onchange="translate();" onmouseup="translate();" onmousemove="translate();"></textarea>
</form>
<h2>Copy and paste this safe code below</h2>
<form onmousemove="translate();">
    <textarea style="width: 900px" id="txtOutput"></textarea><br />
    <button id="btnSelect" onclick="translate();document.getElementById('txtOutput').select(); return false;">Translate and select</button>
</form>
</div>

取一些俄语文本,一些泰语文本等,并将其放入我出色的JS转换器中-它输出ASCII值-这些值我现在可以在PHP数组、html模板等中使用,一切都很好。

我正在为我的PHP翻译类编写一个新方法,将PHP语言数组转换为新语言——这就是问题所在。我如何才能让PHP做这个JS做得很好?我试过htmlentities,iconv等。我想看到这样的翻译文本:

&#1057;&#1086;&#1083;&#1086;&#1084;&#1086;&#1085;&#1086;&#1074;&#1099; &#1054;&#1089;&#1090;&#1088;&#1086;&#1074;&#1072;

СоломоновыОстрова;

这似乎给了我想要的结果:

$s = htmlentities(mb_convert_encoding($s, 'HTML-ENTITIES', 'UTF-8'));

我现在可以看到我需要从浏览器复制并粘贴到新数组中的文本结果。

相关内容

  • 没有找到相关文章