我正在使用APIv2从twitter获取tweet。
为了首先保持数据的可信度,我使用https://api.twitter.com/2/tweets/counts/recent来获取特定查询的tweet计数。后来,我使用相同的参数/查询获取twitter使用https://api.twitter.com/2/tweets/search/recent相同的持续时间然而,在抓取tweet时,我得到的计数比我在计数API中得到的计数少。
的例子:
query parameters for count:
query_params_counts = {"query": "keyword -is:retweet lang:en",
"granularity":"day",
"start_time":"2022-05-09T00:00:00.000Z",
"end_time":"2022-05-010T00:00:00.000Z"
}
for this count is coming: 1766
query_params_tweets = {"query":"keyword -is:retweet lang:en",
"start_time":"2022-05-09T00:00:00.000Z",
"end_time": "2022-05-010T00:00:00.000Z",
"max_results": 100,
"expansions": "author_id,attachments.media_keys,entities.mentions.username",
"tweet.fields": "id,text,created_at,attachments,public_metrics",
"user.fields": "id,name,username,created_at,description,profile_image_url,location,public_metrics,url",
"place.fields": "full_name,id,country,country_code,geo,name,place_type",
"media.fields": "media_key,type,url",
"next_token": {}
}
for this count is: 1751
我试着运行多次,但结果仍然相同。有人能帮我弄明白这是什么原因吗?
这在文档中有解释:
请注意:计数并不总是匹配将从搜索端点返回的结果,因为搜索端点要经过计数端点没有经过的额外遵从性