从网站 Java 复制所选文本



我想从以下网站复制红色文本。我不想要任何HTML代码,因为我可以获得它,但我正在寻找一种方法来简单地复制所有红色文本。我知道我可以手动完成,但这不是我想要的东西。我非常感谢分享任何代码。

http://www.srigranth.org/servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0

JSoup 允许您读取网页并迭代其内容元素。

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();

我不明白该页面上的内容,但看起来您所追求的文本可能是与类dict链接的a的内部 html。 如果是这样的话,

Elements links = doc.select("a.dict");

将为您提供一个可迭代的Element集合,您可以轻松提取其中的文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}

这是基本思想,您可能需要进行一些实验才能使其"恰到好处",但是Jsoup网站上也有很多示例。

最新更新