我正在使用谷歌获得阿拉伯语翻译,这是我的代码:
header('Content-Type: text/html; charset=UTF-8');
$page=file_get_contents("http://www.google.com/translate_t?langpair=en|ar&text=hello",FILE_TEXT);
$page=substr($page,strpos($page,"TRANSLATED_TEXT")+strlen("TRANSLATED_TEXT")+2);
$page=substr($page,0,strpos($page,"';INPUT_TOOL_PATH"));
echo mb_detect_encoding($page); // edited 2015/05/26
echo mb_convert_encoding($page, 'UTF-8', 'ISO-8859-6');
如果您遵循file_get_contents函数上的链接,您将看到这个单词:مرحبا
但是如果你运行代码,你会得到:كرحبا
可以看到,最后(或第一个)字符是不同的!
我做错了什么?
将最后一行替换为:
echo iconv('WINDOWS-1256', 'UTF-8', $page);
我认为这是因为你使用了错误的编码,如果你检查页面返回的内容字符集元数据,你会看到它是windows-1256