在java中使用htmlparser库提取标题标签内容



标签在谷歌页面- <title>Google</title>我试图检索标题标签中的文本内容。但是我没有得到输出。它显示Build successful并抛出输出为"TITLE"。我需要一个输出为"GOOGLE"。这是我的代码。

import org.htmlparser.Node;
import org.htmlparser.Parser;
import org.htmlparser.filters.HasAttributeFilter;
import org.htmlparser.filters.IsEqualFilter;
import org.htmlparser.tags.MetaTag;
import org.htmlparser.tags.TitleTag;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;
public class abc {
public static void main(String[] args) {
       Parser parser=new Parser();

       try
       {
           parser.setResource("http://www.google.com");
          TitleTag title=new TitleTag();
          String tagtext=title.getTitle();
          System.out.println(tagtext);

       }
       }catch (ParserException e) {
        }
    }
}

在您发布的代码中,解析器和TitleTag之间没有连接。

思路是遍历解析器拥有的节点列表(包括TitleTag节点)。

查看java - org.htmlparser.Parser,需要获取h3's

之间的内容

最新更新