AWS EMR定价:有哪些选择?

AWS EMR如何定价?

Amazon Elastic MapReduce (EMR)是为大数据处理和分析服务而设计的工具。EMR是亚马逊网络服务(AWS)的一个产品,但它基于Apache Hadoop,后者是一个编程框架,用于处理跨分布式计算环境的大数据集的处理任务。

Amazon EMR可以跨运行在Amazon Simple Storage Service (S3)和Amazon Elastic Compute Cloud (EC2)上的虚拟服务器Hadoop集群处理大数据。EMR具有动态调整大小的功能,使系统能够根据当前需求增加或减少资源使用。

亚马逊电子病历有几种运行方式,每种都有自己的定价。EMR可以直接运行在Amazon EC2或Amazon Elastic Kubernetes Service (EKS)上,实际实例运行在EC2或Fargate上。EMR是在EC2计算实例、Fargate vcpu和运行EMR作业所需的其他服务(如存储)的常规成本之上,按每秒使用定价的。

这是我们关于……系列文章的一部分AWS定价

在本文中,您将学习:

AWS EMR: 3种部署选项的定价

有三种运行EMR的模型——在Amazon EC2上,在Outposts上(它允许您在本地运行AWS资源),以及在Amazon Elastic Kubernetes Service (E雷竞技rabet官网KS)上。有关最新的价格信息,请参阅官方定价页

亚马逊EC2上的EMR定价

亚马逊电子病历是根据每秒速率基准定价的,在常规服务价格之外收费。在Amazon EC2上部署EMR时,您需要为所选的EC2实例以及EMR处理付费。

例如,对于m4.16xlarge实例,在美国东部地区,EC2实例的成本为每小时3.20美元,EMR的成本为每小时0.27美元(所有实例类型都有相应的EMR成本)。

您可以从任何常规EC2实例定价模型中进行选择,包括保留实例和现货实例。如果您将Amazon EBS卷附加到您的EC2实例上,您还需要为EBS存储付费。

相关内容:阅读我们的指南AWS ECS定价

AWS前哨站点的EMR定价

AWS Outposts是一个托管设备,允许您在本地数据中心运行AWS云服务。您可以购买各种具有EC2实例类型、EBS gp2卷和前哨上的S3组合的AWS前哨配置。定价包括设备的交付、安装、维护和软件更新。

在AWS Outposts上部署EC2实例后,在实例上运行EMR的额外费用与在Amazon云中运行EMR的费用相同。

亚马逊电子病历定价

您可以通过以下两种部署模型在Amazon Elastic Kubernetes Service (EKS)容器上运行EMR:

  • Amazon EC2上的EKS-您支付EC2实例成本,每个新的EKS集群额外收费0.10美元,根据EC2实例类型,EMR额外收费。这与您直接在Amazon EC2上运行EMR时支付的价格相同。
  • 法盖特的几周-您根据EMR所需的虚拟cpu (vcpu)数量和RAM数量支付Fargate费用。从EMR应用程序映像开始下载到EMR作业完成和Amazon EKS Pod终止,Farga雷竞技rabet官网te根据所使用的资源对EMR工作负载收费,最低收费为一分钟。
相关内容:阅读我们的指南亚马逊法盖特定价

AWS EMR成本优化

这里有一些建议和技巧,可以用来节省亚马逊电子病历的成本。

AWS现货实例

对于EMR工作负载,使用它是一个很好的主意AWS现货实例而不是按需实例。EC2现货实例允许您竞标Amazon EC2上未使用的容量。你支付的价格取决于亚马逊现货市场上当前的供需情况。

使用Spot实例的成本可以比同等的按需实例低90%。但是,您需要仔细管理spot实例。当按需、保留实例或储蓄计划客户请求相同类型的实例时,现货实例会在短时间内终止。

要提高EMR工作负载的弹性,请使用以下策略:

  • 混合按需实例和现场实例在按需实例上运行EMR主节点以确保集群的弹性尤为重要。
  • 混合不同的实例类型-避免在需求变化的情况下关闭整个集群,在同一集群中混合不同的实例类型。
  • 使用后备机制-如果使用spot实例的集群启动失败,提供一种备份机制,将实例类型切换到按需,或者寻找具有其他实例类型或运行在其他Amazon可用区域的spot实例。
  • 使用EMR实例群这是Amazon的一项特性,允许您混合使用现货和按需实例,并在同一个自动伸缩组中使用多达五种实例类型。

EMR保留实例

电子病历本身不提供保留的实例定价,但如果需要长时间运行EMR工作负载,则可以使用EC2保留实例。

这意味着您拥有与EC2保留实例相同的定价选项。主要区别在于,除了保留实例的价格之外,您还必须为EMR支付与您选择的EC2实例类型相关的额外费用。

您可以提交1年或3年的EC2保留实例。以下付款方式可供选择:

  • 所有的前期-整个预订期间一次性付款,提供最大折扣。
  • 部分预付-总金额的一部分提前支付,其余部分在预订期间每月支付。
  • 无需预付-每月收费,并承诺继续使用实例1年或3年。这提供了较小的折扣,但差异可以小到3-5%。

EMR集群通常用于执行繁重的计算任务,因此它们往往需要功能强大的EC2实例和多个计算节点。因此,预付选项可能会变成一笔巨大的投资。

EMR集群共享

与其为每个EMR任务启动单独的集群,不如创建一个系统,在几个较小的任务之间共享集群,这样效率更高。

请记住,EMR的最小计费周期为一小时。如果您有几个需要几分钟才能运行的短作业,请在同一个集群上执行所有作业,以填补一个小时的使用时间。如果在单独的集群上运行每个作业,则每个作业都将按整整一个小时计费,即使实际执行时间要短得多。

共享集群的另一个优点是引导新的EMR集群所需的时间较少。最好使用现有集群,因为这样可以节省引导时间,并且可以利用这段时间运行其他作业。

EMR自动缩放

AWS自动扩展对于管理长时间连续运行的EMR集群非常有用。它可以帮助您根据当前运行的作业自动调整集群大小。您可以以5分钟的分辨率自动缩放,这是设置EMR节点所需的时间。

Amazon EMR可以通过编程方式扩展应用程序(如Apache Spark和Apache Hive),添加节点以提高性能。集群可以基于Amazon EMR CloudWatch指标(包括YARN利用率指标)进行扩展。

亚马逊EMR定价优化与现货由NetApp

上述节约成本的最佳实践并不容易实现。例如,为了提高运行在现场实例上的EMR工作负载的弹性,您需要使用不同的实例类型。但是,这样做需要配置和管理多个自动伸缩组。

设置适当的自动伸缩,以自动提供具有正确配置、最小的站立时间和无人为干预的实例,可能需要大量的工作和专门的技术知识。

Spot by NetApp可以帮助AWS EMR用户自动利用以下成本节约策略:

  • 智能地提供最佳组合即时、按需和保留实例,以保持集群以最佳性能运行
  • 监测和预测实时实例行为、容量、定价和中断率,以主动替换有风险的实时实例
  • 预测自动缩放简化了定义扩展策略的过程,并自动扩展以确保工作负载具有合适的容量
  • 管理不同类型的工作负载在同一个集群和跨az上;在同一节点组中使用混合实例类型和大小

ios版雷竞技官网入口

Baidu
map