我在 AWS 实践中遇到了这个问题,想把它贴在这里以供进一步讨论:
您的公司是 计划使用 AWS 中提供的 EMR 服务来运行其 大数据框架,并希望最大限度地降低运行 EMR 的成本 服务。以下哪项可以帮助实现这一目标?
Options:
A. Running the EMR cluster in a dedicated VPC
B. Choosing Spot Instances for the underlying nodes
C. Choosing On-Demand Instances for the underlying nodes
D. Disable automated backups
Correct Answer
B. Choosing Spot Instances for the underlying nodes
问题: 引自 AWS 文档:使用 Spot 实例时,您必须做好应对中断的准备。
我对 EMR 服务的理解是它需要资源来完成作业(服务(,如果说 mapreduce 作业没有足够的资源,作业将失败。 竞价型实例,虽然成本很低,但它不能保证可用性,AWS非常清楚地指出(引用自同一页面(:
如果您的最高价格超过指定价格的当前现货价格 实例,并且容量可用,您的请求已满足 马上。
注意:"容量可用",换句话说,如果容量不可用,您的请求将无法得到满足。
我认为按需实例是应该为底层节点选择的,获得工作比节省成本更重要,如果无法完成工作就毫无意义。
AWS认证考试不断抛出这些东西。
由于没有提到公司不希望任何中断,因此Spot
实例是降低成本的正确答案。
根据我的经验Spot
与on-demand
成本相比,最多可享受80%的折扣。