我正在尝试解析特定div中的一些内容,并将其保存到外部文件中。虽然这是有效的,但我无法完成以下
来自类别为league_container
的div
- 删除类
bar
的所有div - 剥去所有链接。(保留文本,但删除
a
及其属性)
到目前为止,我拥有的是:
<?php
include( 'simple_html_dom.php');
$html = file_get_html('https://some.domain.com/');
$divContents = array();
foreach ($html->find('div.league_container') as $div)
{
$divContents[] = $div->outertext;
}
file_put_contents('parser/est-results.htm', implode(PHP_EOL, $divContents));
?>
如有任何帮助,我们将不胜感激。
使用outertext =
:
$div->outertext = '';
$a->outertext = $a->text();