我正在尝试使用jsoup
Parser for Android解析HTML。
如果我运行我的代码,我无法进入for循环;程序执行在for循环之前停止(没有输出错误)。
我放了日志?当我在普通的java项目中运行时,相同的代码能够得到结果吗?
private class DownloadTwitterTask extends
AsyncTask<String, Void, List<String>> {
String content;
protected List<String> doInBackground(String... urls) {
try {
doc = Jsoup.connect("https://twitter.com/someperson/").get();
} catch (IOException e) {
// TODO Auto-generated catch block
Log.d("Exception", "Exception");
e.printStackTrace();
}
Elements elements = doc.getElementsByAttributeValue("class",
"js-tweet-text tweet-text");
for (int j=0;j<elements.size();j++) {
Element tmp = elements.get(j);
String value = tmp.text();
twitterList.add(value);
}
return twitterList;
}
protected void onPostExecute(List<String> result) {
tadaptor = new TwitterLazyAdaptor(INFOActivity.this, result);
// this.setListAdapter(fadaptor);
lv1.setAdapter(tadaptor);
}
}
你可以试试这个:
doc.select(".js-tweet-text.tweet-text")
开头的 . 表示类,"tweet-text"之前的 . 表示空间。
更新:我将我的解决方案与您的解决方案进行了比较。它给出相同的结果。
您也可以尝试设置用户代理。有时一个网站会返回明显不同的 html。
Document doc = Jsoup.connect("https://twitter.com/someperson/")
.userAgent("Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:24.0) Gecko/20100101 Firefox/24.0")
.get();
您还应该检查"doc"是否为空。如果它是空的,则可能是连接有问题。你也可以像这样做选择 Elements elements = doc.select("p.js-tweet-text tweet-text");
其中"p"是您查找的标签,然后是类属性。还有你设置的 <uses-permission android:name="android.permission.INTERNET" />
以及在哪里执行DownloadTwitterTask