我看到很多博客和帖子比较AWS Athena和Redshift Spectrum。一致的共识似乎是,如果你还没有Redshift的实现,就选择Athena吧。
Redshift Spectrum是否有任何场景或阈值可以更好地支持报告需求,并迫使从Athena切换到Redshift?
--更新--
我在AWS的大数据分析选项白皮书中的Athena 反模式部分找到了以下内容
Amazon Redshift是企业报告和商业智能工作负载的更好工具,涉及冰山查询或缓存数据节点。
那么,可以公平地说,Athena是用于数据分析而非商业智能的吗?
https://www.stitchdata.com/blog/business-intelligence-vs-data-analytics/
所以它归结为存储。只有在像Redshift这样的真正的数据码头设置中,存储大量结构化数据才有意义。
试图将相同级别的数据放入Parquet这样的平面文件中是不合适的。