facebookfql和数据挖掘需要帮助
SELECT post_id, source_id, message, created_time
FROM stream
WHERE source_id IN
(
SELECT target_id FROM connection WHERE source_id=me()
) LIMIT 10
如上所述:
流表的每次查询仅限于前30天或50个帖子,以较大者为准,但您可以使用特定时间字段,如created_time以及FQL运算符(如<或>(以检索更大范围的帖子。http://developers.facebook.com/docs/reference/fql/stream
根据我的经验,你需要进行多次查询才能挤出过去所有可用的帖子。首先,我用最大Facebook限制进行查询,如下所示:
SELECT post_id, source_id, message, created_time, likes
FROM stream
WHERE source_id IN (SELECT target_id FROM connection WHERE source_id=me())
LIMIT 5000
(还请注意,我在选择中添加了"点赞",而您在示例中省略了这一点,如果您打算计算点赞数,则需要这样做(
然后,我解析结果,从上一篇文章中获得created_time值,并将其作为条件创建一个新的查询,如下所示:
SELECT post_id, source_id, message, created_time, likes
FROM stream
WHERE source_id IN (SELECT target_id FROM connection WHERE source_id=me())
AND created_time < 1361472438
LIMIT 5000
然后我重复这个过程并进行额外的查询,直到Facebook返回一个空的结果集。
但即使我做了所有这些,我过去也不会超过6天。
因此,至少从日期来看,这比脸书在文档中所说的要少得多,但按统计,你似乎收到了50多条帖子。