我正在尝试从站点提取数据,但是当我加载PHP文件时,我会自动将其重定向到网站。!
在这里查看视频:http://recordit.co/kowxs5ktkr
php:
$url = "http://extratorrent.cc/view/popular/TV.html?page=1&srt=seeds&pp=50&order=desc";
$ch = curl_init();
curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, FALSE);
$data = curl_exec($ch);
curl_close($ch);
print_r($data);
只是假设:
在查看网站源页面代码时,我将JavaScript视为:
<script type="text/javascript">window.functions = new Array();</script>
<script src="https://extra.to/scripts/script.js?2" type="text/javascript"></script>
我认为这可能会导致重定向,因此,如果这是正确的,那么我将如何防止它?
我做了一些研究,结果是window.location
不能完全禁用,以便该站点不会自行重定向...我想知道我是否可以忽略以将以下代码加载到通过php?
肯定有一个JavaScript检查您的窗口。针对外部域名和IPS的location。尽管我找不到使重定向本身的行,但必须在那里。
r = 0,
d = ['.cc', '.com', '.ws','live.com','.is'],
p = ['195.144.21.16','195.144.21.19','195.144.21.22','88.190.233.44'],
w = window.location,
[...]
for (i in d) {
if (w.hostname == e + d[i]) {
r = 1;
}
}
for (i in p) {
if (w.hostname == p[i]) {
r = 1;
}
}
如果要从本网站提取数据,则应考虑是否需要通过print_r
输出数据。如果您处理内容,则在进行输出之前不会影响您的页面。您可以尝试:
在您的浏览器中禁用JavaScript以进行开发(可能会或可能不起作用,具体取决于网站的依赖JS)。
即使是简单的
str_replace
。处理/解析内容而不将其输出到浏览器中。