我想在雪花中进行某种地理空间连接。目前,运行此查询需要一天以上时间。
我有一个位置数据点表(~10 亿条记录)和另一个 POI 位置表(~6k)(两者都有纬度/纬度作为坐标)。 我想绘制我在 POI 的 X 米内看到的数据点数量。
只能使用雪花或任何开源程序。 任何帮助,不胜感激。
我想看到一个包含以下列的表格:
POI_id半径数据点
哈弗斯函数
执行此操作的方法是通过连接两个表的"on"子句中的哈弗正弦函数。
select *
from table1 a
inner join table2 b
on haversine(a.lat,a.long,b.lat,b.long) <= 10
;
因此,如果 10 公里或更短,请加入,如上例所示