PHP解析HTML表,并使其正确的HTML5表



我正在寻找最好的方法来清理旧的HTML表(与PHP),使他们是正确的HTML5表-这主要是剥离不允许的属性的问题。除此之外,我还想去掉这些表的内联样式。如果能一次完成那就太好了。

我一直在研究正则表达式,但阅读后,正则表达式不建议执行,我正在寻找其他的东西,将帮助。

一个如何使用DOMDocument剥离属性的快速示例-可以扩展它来添加属性,但那是另一回事。

$strhtml="
<table width='100%' cellpadding='10px' cellspacing='5px' border='2px'>
    <tr>
        <td align='left' valign='top'>banana</td>
    </tr>
</table>";
$remove=array('cellpadding','cellspacing','border','align','valign');

$dom=new DOMDocument;
$dom->loadHTML( $strhtml );
$elements=$dom->getElementsByTagName('*');
foreach( $elements as $node ){
    foreach( $remove as $attrib ){
        if( $node->hasAttribute( $attrib ) ){
            $node->removeAttribute( $attrib );
        }
    }
}
/* debug output */
echo '<textarea cols=100 rows=10>',$dom->saveHTML(),'</textarea>';

相关内容

  • 没有找到相关文章

最新更新