HTML简单Dom解析器-如何得到一个特定的文本



嗨,我目前正在使用PHPSimpleDomParser从其他页面源获取日期。您可以在这里查看有关此解析器的更多信息:http://simplehtmldom.sourceforge.net/

我没有问题解析dom元素,如<div></div>, <img>和其他简单的HTML元素

现在我想获得数据文本,这是存储在Javascript中,可以在页面的源代码中看到。

这是我想要得到的确切文本的示例:

"SizeVarId":"37800208195"
"SizeVarId":"37800208215"
"SizeVarId":"37800208235"
"SizeVarId":"37800208175"

正如你所理解的,我想选择所有的"SizeVarId":"RandomNumbers"并获得第二个引号内的数字。

这是可能的吗?我怎么才能得到它?

谢谢!

如果你知道如何使用Regex,这很容易。这里我假设这个Text被赋值给java脚本中的一个变量。

var text = '"SizeVarId":"37800208195""SizeVarId":"37800208215"';
var patt = /"([0-9]+)"/;
var results = patt.exec(text);
console.log(results);

这是在PHP中的操作方法

$url = "http://page-you-want-to.fetch";
$ch = new curl_init($url);
curl_set_opt($ch,CURLOPT_RETURN_TRANSFER,true);
$data = curl_exec($ch);
curl_close($ch);
preg_match_all('/"SizeVarId":"([0-9]+)"/',$data,$matches);
echo '<pre>';
print_r($matches);
echo '</pre>';

相关内容

最新更新