jsoup 解析 HTML 在异步任务 Android 中



我正在尝试使用jsoup Parser for Android解析HTML。

如果我运行我的代码,我无法进入for循环;程序执行在for循环之前停止(没有输出错误)。

我放了日志?当我在普通的java项目中运行时,相同的代码能够得到结果吗?

private class DownloadTwitterTask extends
            AsyncTask<String, Void, List<String>> {
        String content;
        protected List<String> doInBackground(String... urls) {

            try {
                doc = Jsoup.connect("https://twitter.com/someperson/").get();

            } catch (IOException e) {
                // TODO Auto-generated catch block
                Log.d("Exception", "Exception");
                e.printStackTrace();
            }

            Elements elements = doc.getElementsByAttributeValue("class",
                    "js-tweet-text tweet-text");

            for (int j=0;j<elements.size();j++) {

                Element tmp = elements.get(j);
                String value = tmp.text();
                twitterList.add(value);
            }
            return twitterList;
        }
        protected void onPostExecute(List<String> result) {
            tadaptor = new TwitterLazyAdaptor(INFOActivity.this, result);
            // this.setListAdapter(fadaptor);
            lv1.setAdapter(tadaptor);
        }
    }

你可以试试这个:

doc.select(".js-tweet-text.tweet-text")

开头的 . 表示类,"tweet-text"之前的 . 表示空间。

更新:我将我的解决方案与您的解决方案进行了比较。它给出相同的结果。

您也可以尝试设置用户代理。有时一个网站会返回明显不同的 html。

        Document doc = Jsoup.connect("https://twitter.com/someperson/")
                .userAgent("Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:24.0) Gecko/20100101 Firefox/24.0")
                .get();

您还应该检查"doc"是否为空。如果它是空的,则可能是连接有问题。你也可以像这样做选择 Elements elements = doc.select("p.js-tweet-text tweet-text");其中"p"是您查找的标签,然后是类属性。还有你设置的 <uses-permission android:name="android.permission.INTERNET" />以及在哪里执行DownloadTwitterTask

最新更新