提取后台链接,jsoup



我使用jsoup从以下性质的HTML中提取链接时遇到问题。

<div class="post_video" style="background-image:url(http://img.youtube.com/vi/JFf3uazyXco/2.jpg);">

我就是这么做的。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JSoup {
    public static void main(String[] args) {
        String html = "<html><head></head><body><div class="post_video" style="background-image:url(http://img.youtube.com/vi/JFf3uazyXco/2.jpg);"></body></html>";
        Document doc = Jsoup.parse( html );
        Elements elements = doc.getElementsByClass("post_video");
        for( Element e : elements ) {
            String attr = e.attr("style");
            System.out.println( attr.substring( attr.indexOf("http://"), attr.indexOf(")") ) );
        }
    }
}

最新更新