为什么我们可以在 AWS 中将竞价型实例用于 EMR 集群?



我在 AWS 实践中遇到了这个问题,想把它贴在这里以供进一步讨论:

您的公司是 计划使用 AWS 中提供的 EMR 服务来运行其 大数据框架,并希望最大限度地降低运行 EMR 的成本 服务。以下哪项可以帮助实现这一目标?

Options:
A.  Running the EMR cluster in a dedicated VPC
B.  Choosing Spot Instances for the underlying nodes
C.  Choosing On-Demand Instances for the underlying nodes
D.  Disable automated backups 
Correct Answer
B. Choosing Spot Instances for the underlying nodes

问题: 引自 AWS 文档:使用 Spot 实例时,您必须做好应对中断的准备。

我对 EMR 服务的理解是它需要资源来完成作业(服务(,如果说 mapreduce 作业没有足够的资源,作业将失败。 竞价型实例,虽然成本很低,但它不能保证可用性,AWS非常清楚地指出(引用自同一页面(:

如果您的最高价格超过指定价格的当前现货价格 实例,并且容量可用,您的请求已满足 马上。

注意:"容量可用",换句话说,如果容量不可用您的请求将无法得到满足。

我认为按需实例是应该为底层节点选择的,获得工作比节省成本更重要,如果无法完成工作就毫无意义。

AWS认证考试不断抛出这些东西。

由于没有提到公司不希望任何中断,因此Spot实例是降低成本的正确答案。

根据我的经验Spoton-demand成本相比,最多可享受80%的折扣。

最新更新