小贝子编程

在单键和多键分区athena中，哪个性能更高

本文关键字：性能 athena 单键分区 amazon-s3 hive partition amazon-athena presto
更新时间 : 2023-09-18
英文 : Which is more performant in single key and multiple key partitioning athena?

在athena中进行查询时，哪种语法更好，为什么？或者这有关系吗？

只有当您知道要查找什么信息时，才能决定哪个分区的效率更高。当存储的数据太大而无法驻留在单个分区中时，会使用多个分区。使用多个列作为分区键会将数据分成块或存储桶。数据仍然被分组，但被分成更小的块。如果集群在重复向一个节点写入数据时遇到热点或拥塞，这种方法可能是有效的，因为分区正在大量写入。

这取决于很多事情。。你每天、每月的数据量等等。太多的小文件对雅典娜不利。此外，如何查询数据也很重要。请看下面的AWS文章了解更多想法。

https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/

相关内容