如何使用java jsoup连接到站点并检索数据



我知道有很多信息在那里,但我找不到任何适合我的问题。我想从我需要登录的页面收集数据。下面是我要做的:

我收集饼干做:

Connection.Response res = Jsoup
      .connect("http://website.com/login?event=doLogin")
      .execute();
Map <String,String> cookies = res.cookies();

然后读取html中隐藏的值:

 Document doc = Jsoup
      .connect("http://website.com/login?event=doLogin")
      .cookies(cookies)
      .get();

        html = doc.toString();
        length = html.length();
        counter = 0;
        for (int i = 0; i < length; i++) {
            if (html.startsWith("document.write", i)){
                name[counter] = html.substring(i + 41, i + 144);
                value[counter] = "Login";
                counter++;
            }
            if (html.startsWith("hidden", i)) {
                name[counter] = html.substring(i + 13, i + 81);
                value[counter] = html.substring(i + 90, i + 123);
                counter++;
            }
        }

最后,我想使用这些信息登录使用cookie和隐藏值:

 Document doc2 = Jsoup
      .connect("http://website.com/login?event=doLogin")
      .cookies(cookies)
      .data("email", "my@email")
      .data("pass", "mypass")
      .data(name[0], value[0])
      .data(name[1], value[1])
      .data(name[2], value[2])
      .method(Connection.Method.POST)
      .get();
 System.out.println(doc2);

但是我得到的只有登录页面。我担心这些隐藏的值可以改变,当我尝试:

Document doc2 = Jsoup.connect

我做的对吗?

当你设置方法为POST然后调用GET请求时,这是一种混合上下文。试试这个:

Connection.Response res = Jsoup.connect("http://website.com/login?event=doLogin")
                               .execute();
...
Document doc = Jsoup.connect("http://website.com/login?event=doLogin")
                    .cookies(res.cookies())
                    .data("email", "my@email")
                    .data("pass", "mypass")
                    .data(name[0], value[0])
                    .data(name[1], value[1])
                    .data(name[2], value[2])
                    .post();

最新更新