之间的内容
标签在谷歌页面- <title>Google</title>
我试图检索标题标签中的文本内容。但是我没有得到输出。它显示Build successful并抛出输出为"TITLE"。我需要一个输出为"GOOGLE"。这是我的代码。
import org.htmlparser.Node;
import org.htmlparser.Parser;
import org.htmlparser.filters.HasAttributeFilter;
import org.htmlparser.filters.IsEqualFilter;
import org.htmlparser.tags.MetaTag;
import org.htmlparser.tags.TitleTag;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;
public class abc {
public static void main(String[] args) {
Parser parser=new Parser();
try
{
parser.setResource("http://www.google.com");
TitleTag title=new TitleTag();
String tagtext=title.getTitle();
System.out.println(tagtext);
}
}catch (ParserException e) {
}
}
}
在您发布的代码中,解析器和TitleTag之间没有连接。
思路是遍历解析器拥有的节点列表(包括TitleTag节点)。
查看java - org.htmlparser.Parser,需要获取h3's