使用简单的HTMLdom抓取数据,在标签后不带div <br>



我怎么才能得到3行,只提取时间?

<BR>
<BR>UTC=2016-10-12  15:03:58.042 Wed
<BR> LT=2016-10-12  17:03:58.042 Wed (Summer)
<BR>Country/Timezone=+1d (Berlin,Brussels,Paris) ,UTC=60 min.
<BR>Summertime from 25 Mar 01:00, Wintertime from 25 Oct 01:00 (UTC)

所以期望的输出将是:17:03:58.042

我正在尝试用简单的html dom

显示所有文本。我试图找到正确的选择器,但我想要的数据不是一个div之间。只是
谁知道怎么选正确的线?

<?php
// example of how to use basic selector to retrieve HTML contents
include('simple_html_dom.php');
// get DOM from URL or file
$html = file_get_html('http://10.20.83.1/status.htm');
// extract text from HTML
echo $html->plaintext;
?>

1。提取文本

也许使用:

// Find all text blocks $es = $html->find('text');

从http://simplehtmldom.sourceforge.net/manual.htm section_quickstart

注意:如果想要的文本块总是第二个,你可以这样使用:

// Find all text blocks $es = $html->find('text', 2);

2。按格式验证或解释日期。

我曾经写过一个小的php函数来猜测一些日期时间值的格式。参见:http://pastebin.com/DrYwdU2D

如果你愿意,你可以使用正则表达式来做同样的事情:PHP Regex检查日期是YYYY-MM-DD格式

希望能有所帮助。

最新更新