存储具有不同关键字的推文.单个大表,或每个关键字一个表



我将使用Twitter流媒体API来设置真正的实时流,方法是在推文进入时将推文推送到SQL数据库中,然后根据需要随时从我的数据库中提取。这将使我能够在某种程度上绕过速率限制,而不会将自己列入黑名单。我在这里找到了这种方法。

我将跟踪流中的几个关键字(不超过 15 个)

stream.twitter.com/whatever?q=word1 或 单词 2 或 单词 3 或 ...

当我存储这些时,最好将它们全部转储到一个大表中,还是按关键字将它们拼凑出来?我不确定这是否归结为偏好,或者一种方法是否比另一种更好。

我认为最终归结为对它们进行预处理以将它们放入正确的关键字表中,或者从大型表中对它们进行后处理以选择关键字="word1"等的那些。

从优化的角度来看,哪个会更好?

绝对不是为每个关键字单独的表格。

如果你想走关系数据库路由,我肯定会推荐更少的表和更多的索引。 不确定您要做什么,但关键字表,帖子表和keyword_post关联表。

相关内容

最新更新