我使用iconv
php函数,但有些字符不能正确转换:
...
$s = iconv('UTF-16', 'UTF-8', $s);
...
$s = iconv('UTF-16//IGNORE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE//IGNORE', 'UTF-8', $s);
...
我也尝试mb_convert_encoding
功能,但不能解决我的问题。
示例文本文件:9px.ir/utf8-16LE.rar
iconv
支持UTF-16LE
编码
您可以使用它将编码从UTF-16LE
转置到UTF-8
:
$result = iconv($in_charset = 'UTF-16LE' , $out_charset = 'UTF-8' , $str);
if (false === $result)
{
throw new Exception('Input string could not be converted.');
}
参见iconv
Docs。
我只是想知道UTF-16LE
中可用的所有代码点是否在UTF-8
中可用。但我想这应该适合你的情况。
编辑:我无法在我自己的盒子上重现这个问题,但在另一个盒子上我遇到了这个通知:
注意:iconv() [function.]:错误的字符集,不允许从
UTF-16LE' to
UTF-8'转换…
看起来并不是所有的iconv
版本都可以将UTF-16LE
转换为UTF-8
。
使用mb_convert_encoding
Docs可能是一个解决方案,至少在这种情况下(演示):
$result = mb_convert_encoding($str , 'UTF-8' , 'UTF-16LE');
您应该在函数的第二个参数中使用//TRANSLIT
或//IGNORE
,它表示输出字符集。您在第一个参数中错误地使用了它。
请参阅https://www.php.net/manual/en/function.iconv.php