使用 DOMdocument 和 getElementByTagName 函数从网页中提取 img 标签



我必须从我的WP网站的网页中提取源代码。我必须推断每个标签。该页面是产品详细信息,我必须修改woocommerceprintproduct插件的代码。我在插件代码中添加了以下代码:

$dom = new DOMDocument();
libxml_use_internal_errors(true);
$dom->loadHTMLFile("http://www.pecso.it/prodotto/741drinkflex-piatto-nondiv/");
var_dump($dom); 
$imgTags = $dom->getElementsByTagName("img");
var_dump($imgTags);

打印$imgTags I 获得以下值: object(DOMNodeList)#20572 (1) { ["length"]=> int(34) }

现在,我可以提取每个<img>标签吗?

    $images_links = [];$i=0;
    $img_tags = $dom->getElementsByTagName('img');
    if (!is_null($img_tags)) {
       foreach ($img_tags as $img_tag) {
           if ($img_tag->hasAttribute('src')) {
               $src_value = $img_tag->getAttribute('src');
               $images_links[$i] = $src_value;
               $i++;
            }
       }
   }

这样你可以得到属性等等

最新更新