这里的新手程序员刚刚开始学习php,并试图制作我自己的web scraper。我做了大量的搜索,似乎找不到解决方案。
我创建了一个表单,允许用户提交查询,然后从pinterest中抓取图像并显示热门内容。然而,在提交查询后的第一次加载页面时,我得到:"注意:第27行C:\examplep\htdocs\domwebcrawler.php中的未定义偏移量:0"(28&29)。刷新X次后,页面将最终加载图片。
这些行对应于我的代码行
HTML/PHP-
<html>
<head>
<link type="text/css" href="domwebcrawler.css" rel="stylesheet" media="all" />
</head>
<body>
<form action="<?php echo $_SERVER['PHP_SELF'] ?>" method="get">
<input type="text" name="searchquery"> <input type="submit"> <br>
What do you want to search today?
<?php
include 'simple_html_dom.php';
$dom = new simple_html_dom();
@$query = $_GET["searchquery"];
if (!empty($query)) {
$dom->load_file('http://pinterest.com/search/pins/?q=' . urlencode($query));
$images= $dom->find('.PinHolder img');
$descriptions = $dom->find('.description');
$repins = $dom->find('.RepinsCount');
?>
<div class="js-masonry" data-masonry-options='{"itemSelector": ".pins", "columnWidth":10}'>
<?php
for ($i=0; $i< 20 ; $i++) {
echo '<div class="pins">';
if($images[$i])
echo '<div class="pinimg">' . $images[$i] . '</div>';
if($descriptions[$i])
echo '<div class="description">'. $descriptions[$i] . '</div>';
if($repins[$i])
echo '<div class="repin_count">' . $repins[$i] . '</div>';
echo '</div>';
};
};
?>
</div>
</body>
<script src="masonry.js"></script>
<script src="jquery.js" type="text/javascript"></script>
<script src="jquery.lazyload.js" type="text/javascript"></script>
</html>
CSS
.pins {
padding: 1%;
margin:1%;
border:solid 3px black;
width: 200px;
}
.pinimg img{
width:100%;
}
.description, .repin_count {
text-align: center;
}
我认为它可能有一些原因,因为页面在加载所有刮来的内容之前就加载了?但我不确定!
欢迎所有帮助(以及对低效代码的批评)!
热烈问候
您的代码假设在$images、$descriptions和$repins的[0]位置中总是有一些东西。
使用isset来避免该消息
if($images[$i])
echo '<div class="pinimg">' . $images[$i] . '</div>';
if($descriptions[$i])
echo '<div class="description">'. $descriptions[$i] . '</div>';
if($repins[$i])
echo '<div class="repin_count">' . $repins[$i] . '</div>';
@Amal说得很对。只要确保添加isset即可。检索到的每个对象都是数组。您正在访问一个不存在的数组索引。
<?php
include 'simple_html_dom.php';
$dom = new simple_html_dom();
$query = "html";
function print_type($var){
echo gettype($var);
echo "</br>";
if (is_array($var)){
echo sizeof($var);
}
echo "</br>";
}
if (!empty($query)) {
$dom->load_file('http://pinterest.com/search/pins/?q=' . urlencode($query));
$images= $dom->find('.PinHolder img');
print_type($images);
$descriptions = $dom->find('.description');
print_type($descriptions);
$repins = $dom->find('.RepinsCount');
print_type($repins);
?>
<html>
<head>
<!-- put some info here-->
<title>Pinterest parser</title>
</head>
<body>
<?php
for ($i=0; $i< 20 ; $i++) {
?>
<div class="pins">
<?php
if(isset($images[$i])){
?>
<div class="pinimg">
<?php
echo $images[$i]
?>
</div> <!-- end pinimg -->
<?php
}
?>
<?php
if(isset($descriptions[$i])){
?>
<div class="description">
<?php
echo $descriptions[$i]
?>
</div><!-- end description -->
<?php
}
?>
<?php
if(isset($repins[$i])){
?>
<div class="repin_count">
<?php
echo $repins[$i]
?>
</div> <!-- end repin_count -->
<?php
}
?>
</div><!-- end pins-->
<?php
}
}
?>
</body>
</html>