既然QuickSight可以直接查询S3,那么我们什么时候需要使用Athena作为QuickSight的数据源



可能我遗漏了一些东西,但我不明白如果我将Athena与QuickLight连接起来,而不是将QuickLight直接与S3连接起来,我会得到什么好处。请帮我理解这一点。

AmazonS3是一个为存储和检索任何数量的数据而构建的对象存储。基本上,它有一些原始数据或非结构化数据(以特定的文件格式.csv.tsv)。

Amazon Athena使用托管数据目录来存储信息和关于为数据创建的数据库和表的模式存储在AmazonS3中。因此,雅典娜知道数据及其结构(即某个模式)。

此外,QuickLight可以直接连接到Athena数据库并查询数据进行分析。当您连接到Athena数据库时,您最有可能处理结构化或半结构化数据

当数据源为Amazon Athena时,不需要Amazon S3清单文件

直接连接到S3时的一些限制:-

清单中指定的任何文件的大小都不能超过1 GB指定的所有文件的大小不能超过10 GB,并且总数指定的文件数不能超过1000。

使用create The Data Set Using Amazon Athena Data时,上述限制不可用。

使用Amazon Athena数据创建数据集时的另一个功能:-

您可以直接分析数据,而无需加载或加载到SPICE中并对数据进行分析。

结论:-

如果您还没有对S3文件做任何操作,您可以直接使用QuickLight,将S3作为数据集。

在这种情况下,如果您已经将S3数据加载到Athena中,那么您可以使用Athena作为QuickLight的数据集。

通过使用Athena或任何其他数据源,您将获得很少的好处,并且可以克服上面提到的一些限制(即文件大小)。

最新更新