APPROX_COUNT_DISTINCT实际上是如何获得更好的性能的,以及为什么我们从该函数中获得的计数不准确?内部是否使用HASH GROUP BY?
来源https://db-blog.web.cern.ch/blog/luca-canali/2014-08-scaling-cardinality-estimates-12102我们可以发现它使用了HyperLogLog算法,并在Alex Fatkulin的博客上提供了其描述的链接:http://afatkulin.blogspot.com/2013/11/hyperloglog-in-oracle.html
PS。RIP Alex。。。希望他的文章还活着。。。