总是使用现货实例的关键任务工作量进行中断的风险,使他们的使用,虽然经济上有吸引力,从可靠性角度小于理想。现货,NetApp使吗云消费者使用现货实例大幅节省成本,同时保证高可用性对于各种工作负载。我们云基础设施的核心产品是现货可用性分数,这是杠杆提供最大的可用性,同时减少风险。
聪明、连续和自动选择
AWS现货市场产能约15000点实例池在全球范围内,每一个独特的地区/可用性区域,实例类型,大小和操作系统。与现货可用性不断变化的供应和需求的基础上,确定哪些现货实例将终止长寿需要访问大量的历史数据和当前EC2 consumption-upon机器学习算法可以学会准确地预测能力池的行为。
数十亿的事件收集的平台,NetApp的这种独特的数据访问。加上我们的预测调整算法,我们能够可靠地预测90%——现货实例将被打断,这将有更大的寿命,给客户的最低成本SLA云计算和企业级高可用性。
的核心组件之一的预测调整功能集是现货市场可用性得分。现货市场可用性分数是决定基于能力和行为,以及动态变量如长期季节性(例如,“黑色星期五”时期)和短期变化(例如,一个一分钟前发生的中断)。预测再平衡是一组功能不断优化底层实例,以确保成本优化的混合与高可用性。平衡功能,包括最小实例生命周期和恢复的能力优先配置,利用可用性得分显著执行操作。
可用性得分作为优化的数据源
AWS最近宣布EC2点位置得分,一个新功能,使客户能够获得一些洞察能力池的可用性。AWS得分位置使用规模从1到10,10表明现货请求很可能成功,和一个表明它不会。
虽然这种可用性得分提高创建和更新的经验使用现货实例的配置自动定量组织,它只提供了洞察启动实例操作和没有解决市场稳定所需考虑连续优化和自动化。AWS允许用户通过一个API查询成绩,但是他们有权限制API调用,如果他们“检测模式与现货得分位置特性的用途。”
市场分数是基于无限的市场容量和成本动态更新变化。根据所有AWS的变量使用客户,市场分时间配置的组之间有很大的差异和峰值时间。这是一个重要的利益点的预测调整,不断地监控市场成绩并更新组的市场分布按照当前和预测的可用性和成本。
点的算法考虑许多统计数据在计算分数。在图2中,所述输入的模型为:
- 高频信号,例如,自上次中断的时候,采样周期的稳定一小时前,和中断一小时前的数量;
- 远程季节性信号,如周假期的日子;
- 全局池统计数据,如需实例的数量与数量的现货市场当前正在运行的实例;
- 元数据,学习不同的家庭之间的关系(例如,GPU实例吗?)。
- 结合所有的统计数据,我们可以预测未来基于相关性。为此,我们采用最先进的深度学习算法和梯度增加模型训练多年的数据。
市场分数监测和调整活动可以执行:
- 替换操作—预测平衡不断监控市场的分数和决定是否特定实例的当前市场是稳定的或者应该被取代。
- 扩大业务,预测平衡检查分数的潜在市场新推出的实例:(i)增加更多的容量扩展的一部分活动;或(2)替换操作,可以引发的预测实例的可用性或者用户的偏好,如恢复首选AZ,回复到首选实例类型,和回复到RI / SPs一旦可用。
预测调整检查分数和决定最好的市场运行,基于用户定义和配置偏好。
例如,一个用户指定首选AZ上运行(例如,us-east-1)首选实例类型(例如,m5.4xl)。预测再平衡将考虑用户偏好和市场的分数来执行启动实例操作:
- 现货市场不断计算可用性分数为所有基于最近的市场行为,我们所有的客户和长期的季节性;
- 得分的基础上,预测平衡各种用户首选市场;
- 如果分数很低的首选市场,预测再平衡将试图启动实例的其他配置az或现货实例类型;
- 如果没有稳定的市场,(即。,all the configured markets are below a dynamic threshold) predictive rebalancing will fallback to on demand in order to maintain the required capacity and keep the availability of the application.
上面的例子通常描述的一些决策,考虑启动一个实例操作期间。这只是一小部分的整个预测平衡特性,优化集团在其整个生命周期。现货NetApp的预测算法,帮助我们的客户不断优化成本,同时保证可用性。
首先,了解更多Elastigroup或海洋。