嗨,我目前正在使用PHPSimpleDomParser从其他页面源获取日期。您可以在这里查看有关此解析器的更多信息:http://simplehtmldom.sourceforge.net/
我没有问题解析dom元素,如<div></div>
, <img>
和其他简单的HTML元素
现在我想获得数据文本,这是存储在Javascript中,可以在页面的源代码中看到。
这是我想要得到的确切文本的示例:
"SizeVarId":"37800208195"
"SizeVarId":"37800208215"
"SizeVarId":"37800208235"
"SizeVarId":"37800208175"
正如你所理解的,我想选择所有的"SizeVarId":"RandomNumbers"
并获得第二个引号内的数字。
这是可能的吗?我怎么才能得到它?
谢谢!
如果你知道如何使用Regex,这很容易。这里我假设这个Text被赋值给java脚本中的一个变量。
var text = '"SizeVarId":"37800208195""SizeVarId":"37800208215"';
var patt = /"([0-9]+)"/;
var results = patt.exec(text);
console.log(results);
这是在PHP中的操作方法
$url = "http://page-you-want-to.fetch";
$ch = new curl_init($url);
curl_set_opt($ch,CURLOPT_RETURN_TRANSFER,true);
$data = curl_exec($ch);
curl_close($ch);
preg_match_all('/"SizeVarId":"([0-9]+)"/',$data,$matches);
echo '<pre>';
print_r($matches);
echo '</pre>';