PHP脚本,用于获取网站的动态加载计划



我正在尝试制作一个php脚本,它可以从用Yii Framework编写的特定网站获取特定的电视频道时间表。我正在尝试使用 php cURL 获取完整的 HTML,但我找不到本节。

$curl = curl_init('http://port.hu/tv');
curl_setopt ($curl, CURLOPT_POSTFIELDS, 'id=tvchannel-3&date=2017-02-05'); // for example
curl_setopt($curl, CURLOPT_FAILONERROR, true);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_POST, 1);
$content = curl_exec($curl);
echo $content;

我之前尝试过使用 php file_get_contents 得到相同的结果。知道吗?谢谢。

您不能直接从网站页面抓取,因为看起来该网站正在使用 ajax(我猜(将数据加载到页面上。所以我做了什么,我使用 Chrome 开发者工具监控页面上的网络活动,我找到了这个 API 网址:

http://port.hu/tvapi?channel_id=tvchannel-3&i_datetime_from=2017-02-05&i_datetime_to=2017-02-10

它返回了 JSON 字符串,开发人员不保护 API。因此,无需再抓取,只需直接加载 JSON API 即可。

最新更新