雪花仓库的尺寸应该是多少



我们决定用雪花重新构建我们的产品存储,以存储我们的时间序列数据。目前,我们有10 TB的时间序列数据(每天增加(和6个作业,每15分钟触发一次并利用几乎40GB/天的数据进行处理。我们正在使用Microsoft Azure云。

由于我们没有得到雪花节点/服务器/集群的确切大小,你能建议我们应该选择什么样的仓库大小吗。

仓库大小可以随时修改。所以你可以从一个小的开始,然后增加尺寸,直到你找到最佳尺寸。您还可以使用多个仓库,这样您就可以重新分配工作负载。

我建议您关注集群密钥,而不是仓库大小,因为在您的情况下,选择正确的集群密钥进行有效的数据修剪将非常重要:

https://docs.snowflake.net/manuals/user-guide/tables-clustering-keys.html#benefits-为非常大的表定义聚类键

相关内容

  • 没有找到相关文章

最新更新