雪花云数据平台仓库失败时的查询行为



我使用snowflake来验证它是否可以用于DWH,并且我关心当仓库出现故障时的查询行为。

https://docs.snowflake.com/en/user-guide/warehouses-considerations.html multi-cluster-warehouses-improve-concurrency根据上面的页面,如果将最小集群设置为大于1,则有助于确保可用性和连续性。我对此有些疑问。

1。如果我们将其设置为1并且仓库失败,那么继续进行的查询就会失败?2.如果我们将其设置为2或更多,并且仓库的一个集群失败,则继续进行的查询将失败并由另一个集群自动启动?

当一个仓库出现故障时,将自动启动一个新的仓库,并退出查询。在我上一份工作的6年里,我们经营snowflake,只有不到12次仓库故障。

通常是在发布版本的时候。失败时确实会发生的一件事是发布被推迟了。因此,我们注意到处理速度的变化,或者总时间的增加,并且在故障期间,查询概要文件可能为每次重试显示1-3个查询计划选项卡。

这些中断中至少有一次是未能建立新的仓库,这类问题,在那次事件中,我认为我们没有受到影响,因为我们的东西一直在运行。

另一个边注是,你会为这些失败付费,所以如果你在做大型计算,它会失败并重试。当我们能够证明由于已知的故障事件而导致成本增加时,我们已经退还了(额外的成本)。

但是如果你看的是中型和小型仓库,它们通常在同一秒启动,所以你可能不会注意到"失败"。但是,如果您正在运行一个非常大的实例大小,则可能需要更长的时间才能使该容量在线。

最新更新