从HTML字符串的Regex处理IDE(Java)

，让我们给出一些背景。我试图从网页（Web Crawling）中获取一个动态值，一旦IVE解析/接收，我也能够应用条件。

这是页面参考：http：//www.nba.com/gameline/heat/

我正在尝试获取图表中团队的"胜利"变量的数量，然后应用条件。我已经在草图中成功加载了页面的内容，但是由于我理解如何编写正则表达式的范围有限，我正在收到PatternSyntaxException错误。

代码下面：

String webpage = "";
String [] webpageArray = loadStrings("http://www.nba.com/gameline/heat/");

for(int i=0;i<webpageArray.length;i++){
  webpage += webpageArray[i];
}

webpage = webpage.replace("  "," ");
webpage = webpage.replace(" ","");
println(webpage);
//String[] m1 = match(webpage, "<div id="article">(.*)</div></div>");
String[][] m1 = matchAll(webpage, "(?<=nbaTmOverStats.*?nbaTeamFG4">)\d+");
//String[] m1 = match(webpage, "NAKED (.*) - just two");
//println(webpage);
//println(m1[1]);
size(640,480);
background(255);
fill(0);
//String s = m1[1];
//text(s, 15, 20, width, height);

使用

<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\d+)</td>

这将以ID =" nbateamfg4"提取字段的数值。由于Matchall是一种与处理2.0 相对应的方法，因此将数据输出看起来像

    String m1[][] = matchAll(webpage, "<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\d+)</td>");
    //Print the first match
    println(m1[0][1])'

相关内容

最新更新

热门标签：