Azure 网站 - 最大程度地减少小规模频繁中断



我有一个托管在 azure 上的 SaaS 产品。我有一个单独的 .net Web 应用和简单的营销网站,两者都作为网站托管在 azure 上。两者都设置为一个实例,并配置了自动缩放。

我担心我的网站会发生小规模的频繁中断。Azure 说每周大约需要 10 分钟,这在 SLA 范围内,但我想尽可能减少这种情况。

因此,对于我的营销网站,我将实例计数更改为 2 并删除了自动缩放。从我读到的内容来看,拥有 2 个实例应该确实有助于解决任何问题 - 正如 azure 自己所说:

请注意,无论网站模式如何,Azure 网站都已为数据中心(也称为区域)内的网站提供了故障转移负载均衡功能。

这听起来很棒。但。。。目前没有任何区别。我已经让pingdom监控营销网站和主应用程序,今天早上我有2次2分钟的中断。这两个站点都有完全相同的问题,并同时得到解决。

我是不是期望太高了?所有文档都表明这是缓解此问题的好策略(缺少流量路由管理器)。

谢谢

您运行的是哪种缩放模式?如果是"基本"或"标准",是否已打开"始终开启"标志?

http://azure.microsoft.com/en-us/updates/azure-web-sites-adds-always-on/

看起来这个问题有点流行,所以我发布了一个更新 - 一年后......

到目前为止,我的观察:

我大约一年前经历的中断大部分(但不是完全)停止了。我认为其中大多数都是 Azure 中的事情发生了变化,并且在这里和那里将网站淘汰了几分钟 - 最近我没有遇到过类似的问题。虽然从那以后我改变了很多...

  1. 我总是确保任何运行时间稍长的东西都被移出到队列中
  2. 我确保采用重试策略与外部服务通信,以使应用更具弹性。
  3. 除非我需要吞吐量,否则我不会在超过 1 个实例上运行 - 它通常无助于恢复我最初发布的问题。
  4. 我现在运行一个"大型"实例。自从我变大后,我遇到的问题似乎少了很多。也许这部分是因为虚拟机提高了启动速度,或者额外的 RAM/CPU 使其更有能力处理问题,我不确定。

获得更高可用性的一个选项是在两个不同的区域中创建两个相同的站点,并使用 Azure 流量管理器从一个站点故障转移到另一个站点,以防其中一个站点出现故障。

最新更新