我们在S3中存储了数千个文件。这些文件被公开给athena,以便我们可以查询它们。在进行调试时,我发现athena在查询特定的id
时显示了多个空行。考虑到有成千上万的文件,我不确定这些数据是从哪里来的。
有没有一种方法可以让我在athena结果中看到相应行的源文件?
Presto Hive连接器暴露了一个隐藏列:"$path"
此列显示从中读取特定行的文件的路径。
注意:列名实际上是$path
,但您需要在SQL中引用"
。这是因为$
在标识符中是非法的。