使用twitter4j获取给定位置周围的所有推文



我想使用 Twitter4j 从 Twitter API 获取所有推文。这是我使用 geoCode 获取推文的代码,但我无法获取所有推文,它只向我显示大约 100 条推文。有什么办法可以将它们全部获取。我认为我可以收到的推文数量有速率限制,但我不确定。谁能帮忙?

import java.util.List;
import twitter4j.*;
import twitter4j.auth.AccessToken;
public class Main {
public static void main(String[] args) {
    final Twitter twitter = new TwitterFactory().getInstance();
    final  AccessToken accessToken = new AccessToken("XXX", "YYY");
    twitter.setOAuthConsumer("AAA", "BBB");
    twitter.setOAuthAccessToken(accessToken);
    try {
        Query query = new Query();
        query.geoCode(new GeoLocation(37.781157,-122.398720),1000.0,"mi");
        QueryResult result;
        System.out.println("Searching...");
        int Count=0;
        do {
            result = twitter.search(query);
            List<Status> tweets = result.getTweets();
            for (Status tweet : tweets) {
                if(tweet.getGeoLocation()!=null)
                    System.out.println(tweet.getGeoLocation());
            }
            try {
                Thread.sleep(500);
            } catch (InterruptedException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        }
        while ((query = result.nextQuery()) != null);
        System.out.println(Count);
        System.exit(0);
    } catch (TwitterException te) {
        te.printStackTrace();
        System.out.println("Failed to search tweets: " + te.getMessage());
        System.exit(-1);
    }
}

}

您在如何处理解决方案方面遇到了一些问题。

你的代码很好
您要求Twitter在过去几天内在给定位置获得一些推文,这就是Twitter给您的(目前约有400条推文),所以......为什么推文这么少?为什么其他网站有这么多推文?主要问题是搜索 API。

搜索接口
您需要知道搜索 API 侧重于相关性而不是完整性,因此您只能收到最后几天(大约一周)的一些推文,并且如文档所述:

如果要匹配完整性,应考虑改用流式处理 API

这将引导我们进入下一步...

流媒体 API
在流式处理 API 中,您无法搜索推文,而是实时获取它们。如果你想要一个月的本地化推文,你需要在流式处理 API 上设置绑定,并让它运行一个月。在 Twitter4j 上,您需要设置本地化过滤器,然后运行流媒体,如下所示:

    ConfigurationBuilder cb = new ConfigurationBuilder();
    cb.setDebugEnabled(true).setOAuthConsumerKey("---")
            .setOAuthConsumerSecret("---")
            .setOAuthAccessToken("---")
            .setOAuthAccessTokenSecret("---");
    TwitterStream twitterStream = new TwitterStreamFactory(cb.build())
            .getInstance();
    StatusListener listener = new StatusListener() {
        @Override
        public void onStatus(Status status) {
                //here you do whatever you want with the tweet
            System.out.println(status.getText());
        }
        @Override
        public void onException(Exception ex) {
            ex.printStackTrace();
        }
        @Override
        public void onDeletionNotice(StatusDeletionNotice arg0) {
                  // TODO Auto-generated method stub
        }
        @Override
        public void onScrubGeo(long arg0, long arg1) {
        }
        @Override
        public void onStallWarning(StallWarning arg0) {
            // TODO Auto-generated method stub
            System.out.println(arg0);
        }
        @Override
        public void onTrackLimitationNotice(int arg0) {
            // TODO Auto-generated method stub
            System.out.println(arg0);
        }
    };
    twitterStream.addListener(listener);
    FilterQuery filterQuery = new FilterQuery();
    double[][] locations = {{-74,40}, {-73,41}}; //those are the boundary from New York City
    filterQuery.locations(locations);
    twitterStream.filter(filterQuery);
    twitterStream.filter(filterQuery);

如果你收到太多的推文,流媒体 API 会削减它们,所以尽量不要将边界框设置为大。
但。。。如果我想要过去的推文,我现在就想要它们?
这是Twitter获得一些额外资金的地方,您可以使用Gnip获得它们

最新更新