我想通过php domdocument解析HTML网页,然后从其Alt属性中提取IMG。像getElementById()
这样的功能。有什么办法吗?
domdocument的方法称为getElementsbytagname,可用于通过标记名称获取元素。例如
<?php
$htmlStr = <<<EOD
<!DOCTYPE html>
<html>
<head>
<title>Some nice page</title>
</head>
<body>
<h1>Something nice</h1>
<img id="beautiful-para" src="https://" alt="foo-hj" />
</body>
</html>
EOD;
$doc = new DomDocument;
$doc->validateOnParse = true;
$doc->loadHTML($htmlStr);
$images = $doc->getElementsByTagName('img');
foreach ($images as $image) {
var_dump($image->getAttribute('alt'));
}
这将给出
string(6) "foo-hj"
希望这会有所帮助。