从HTML字符串的Regex处理IDE(Java)



,让我们给出一些背景。我试图从网页(Web Crawling)中获取一个动态值,一旦IVE解析/接收,我也能够应用条件。

这是页面参考:http://www.nba.com/gameline/heat/

我正在尝试获取图表中团队的"胜利"变量的数量,然后应用条件。我已经在草图中成功加载了页面的内容,但是由于我理解如何编写正则表达式的范围有限,我正在收到PatternSyntaxException错误。

代码下面:

String webpage = "";
String [] webpageArray = loadStrings("http://www.nba.com/gameline/heat/");

for(int i=0;i<webpageArray.length;i++){
  webpage += webpageArray[i];
}

webpage = webpage.replace("  "," ");
webpage = webpage.replace(" ","");
println(webpage);
//String[] m1 = match(webpage, "<div id="article">(.*)</div></div>");
String[][] m1 = matchAll(webpage, "(?<=nbaTmOverStats.*?nbaTeamFG4">)\d+");
//String[] m1 = match(webpage, "NAKED (.*) - just two");
//println(webpage);
//println(m1[1]);
size(640,480);
background(255);
fill(0);
//String s = m1[1];
//text(s, 15, 20, width, height);

使用

<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\d+)</td>

这将以ID =" nbateamfg4"提取字段的数值。由于Matchall是一种与处理2.0 相对应的方法,因此将数据输出看起来像

    String m1[][] = matchAll(webpage, "<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\d+)</td>");
    //Print the first match
    println(m1[0][1])'

最新更新