试图从网页中提取评论数



我正在尝试使用Jsoup从网页中提取总体评论数。例如,这里有一个页面(CNN): http://edition.cnn.com/2011/POLITICS/07/31/debt.talks/index.html?hpt=T1

我看到类ID是cnn_strycmtsndff,但无法找到正确的命令来提取它。

有人能帮忙吗?

谢谢

不幸的是,我认为Jsoup不会成功。如果你使用Chrome开发工具,你可以清楚地挑选出用于呈现"(##### Comments)"部分的HTML,但如果你只是查看源代码,这些信息都没有。似乎他们正在使用一些Javascript来动态地将信息嵌入到页面中。

这是你在"View Source"中看到的内容:

<div id="disqus_thread"></div><script type="text/javascript" src="http://cnn.disqus.com/embed.js"></script>

因此Jsoup将永远无法看到带有注释信息的元素。

最新更新