容错-HP(Tandem)Non-stop与Linux集群相比如何



HP NonStop系统(以前称为"Tandem")以其高可用性和可靠性以及更高的价格而闻名。

在这些方面和其他方面,基于Linux或Unix的集群与它们相比如何?

在容错机器上,容错直接在硬件中处理,对应用程序透明。对集群进行编程需要明确处理应用程序中的容错。

在实践中,集群应用程序体系结构的构建要比为NonStop等容错平台构建的应用程序复杂得多,而且容易出错。这意味着,正如伦敦证券交易所(London Stock Exchange)艰难地发现的那样,应用程序错误导致的不可靠性范围要大得多。他们有一个基于Tandem的现有系统,这是证券交易所交易应用程序的常见架构。他们的新任首席执行官有一个聪明的想法,认为微软是前进的道路,并成立了一家五大咨询公司。基于120台服务器集群的Net系统。

集群应用程序的问题在于,故障可能是相互关联的。如果系统中存在应用程序或配置错误,通常会在所有节点上进行复制。这意味着你可以得到一个可以摧毁整个集群的单一情况或事件。集群应用程序的额外复杂性使它们在开发和部署时更容易出错,这增加了发生这种情况的几率。构建在(例如)Linux和J2EE上的集群系统容易受到相同类型故障模式的攻击。

IMHO这是旧式大型机体系结构的一个主要优势。几家供应商(IBM、HP、DEC,可能还有我想不出的其他几家)制造了容错系统。这种类型的系统的底层编程模型比集群的n层应用程序服务器稍微简单一些。这意味着相对来说没有什么问题,只要付出一定的努力,你就可以实现一个更可靠的系统。令人惊讶的是,许多古老的建筑仍然健在,在市场中过得相当舒适。IBM仍然销售大量的Z和I系列机器;Unisys仍然生产A系列和2200系列;VMS和NonStop在HP中仍然存在。这些系统的销售并不是全部面向现有客户,例如,在I系列上运行的商业承销系统(GENIUS)仍然是这一细分市场的市场领导者,在我写这篇文章的时候,新的产品正在推出。据我所知,该应用程序已经经历了两次重写尝试(1次在Java中,1次在.Net中),而且"老派"平台似乎并没有真正束缚它的风格。

我现在不会做空任何屏幕刮刀供应商。。。

灰色&Reuter的事务处理:概念和技术有些枯燥和学术性,但对容错系统架构有很好的处理。其中一位作者是Tandem系统设计的关键人物。

最新更新