我写了一个机器人,在网页中获取所有的URL。url是这样的:
http://www.example.com/result/رایانه
现在,当我尝试通过CURL获取这个url的内容时,给我这个错误:
400 Bad request
我知道这个原因,因为url中的"رایانه"
必须编码。
但那个URL是动态的,我需要一个解决方案来编码URL中的参数。
像这样:
"http://www.example.com/result/" . urlencode("رایانه")
或者另一个例子:
也许我有这个URL:
http://www.example.com/result/سوتی/?foo=علی&bar=حسن
如果我使用urlencode()
返回这个:
http%3A%2F%2Fwww.example.com%2Fresult%2F%D8%B3%D9%88%D8%AA%DB%8C%2F%3Ffoo%3D%D8%B9%D9%84%DB%8C%26bar%3D%D8%AD%D8%B3%D9%86
所以必须只编码这些词:سوتی
, علی
, حسن
。
并将其正确编码:
http://www.example.com/result/%D8%B3%D9%88%D8%AA%DB%8C/?foo=%D8%B9%D9%84%DB%8C&bar=%D8%AD%D8%B3%D9%86
我需要这个在CURL中使用。
我该怎么做呢?
我找到了这个代码:
echo implode("/", array_map("urlencode", explode("/", $string)));
返回:
http%3A//www.example.com/result/%D8%B3%D9%88%D8%AA%DB%8C/%3Ffoo%3D%D8%B9%D9%84%DB%8C%26bar%3D%D8%AD%D8%B3%D9%86
但结果并不完全正确
我找到了一个解决方案:
$string = 'http://www.example.com/result/سوتی/?foo=علی&bar=حسن';
$string = urlencode($string);
echo str_replace(array('%3A', '%2F', '%3F', '%3D', '%26'), array(':', '/', '?', '=', '&'), $string);
输出:http://www.example.com/result/%D8%B3%D9%88%D8%AA%DB%8C/?foo=%D8%B9%D9%84%DB%8C&bar=%D8%AD%D8%B3%D9%86