阅读Instagram个人资料中的文字



问题是,如果用户输入Instagram URL,如何从Instagram个人资料中读取文本。我尝试使用java.net.URL,得到的只是大量的HTML文本。我对使用网页知之甚少,所以我正在寻求一些帮助,了解如何从个人资料中获取文本(个人简介、帖子标题、评论(。

谢谢!

您可以使用刮削工具(Parsehub的刮削等(。不过,提醒一下,这违反了Instagram的TOS,所以要小心hint-hint-

Hello,您可以将html代码拆分为html标记前后的字符串。

取列表中的第二个字符串进行第一次拆分,取列表中第一个字符串进行第二次拆分。

但是你需要一些html的知识,才能知道什么是html标签,以及如何找到需要拆分的标签。

玩得开心,我希望我能帮助你!

您可以使用jsoup(https://jsoup.org/)从html内容中提取特定标签。

下面是一个从HTML正文中提取h1标记内容的示例。

// Parse HTML String using JSoup library
String HTMLSTring = "<!DOCTYPE html>"
+ "<html>"
+ "<head>"
+ "<title>JSoup Example</title>"
+ "</head>"
+ "<body>"
+ "<table><tr><td>
<h1>HelloWorld</h1></tr>"
+ "</table>"
+ "</body>"
+ "</html>";

Document html = Jsoup.parse(HTMLSTring);
String title = html.title();
String h1 = html.body().getElementsByTag("h1").text();

你可以从下面的博客文章中找到更多的例子https://javarevisited.blogspot.com/2014/09/how-to-parse-html-file-in-java-jsoup-example.html

希望这会有所帮助。

最新更新