使用jerichohtml解析器分析页面中指定的文本



从页面检索指定文本时遇到问题。我使用的例子是专利受让人摘要

如果你去网站,你会看到有一个"总计:82"(这是标准SASA的点击次数)。我需要这个号码。我使用了jerichohtml解析器,但我找不到任何函数。

有人能帮我做这个吗?我真的需要把这个号码写在纸上。

提前感谢-Sasa

如果您可以切换到Jsoup:

/* Connect to URL and parse it into a 'Document' */
Document doc = Jsoup.connect("http://assignments.uspto.gov/assignments/q?db=pat&qt=asne&reel=&frame=&pat=&pub=&asnr=&asnri=&asne=sasa&asnei=&asns=").get();
/* Select the required tag and print the value */
System.out.println(doc.select("p.t2").first().text());

完成!

输出:

总计:83(价值在网站上更改)

选择器解释道:

doc.select("p.t2") // Select each 'p'-tag with 't2' attribute from document
   .first() // Get the first one (there are two on the website, but the first one is the required one)
   .text() // Get the text of this element

文档:

  • 食谱(示例)
  • 选择器API
  • API文档(JavaDoc)

相关内容

  • 没有找到相关文章