当企业将 IT 基础设施和应用程序迁移到 AWS 云时,服务级别协议(SLA Agreement) 是一个核心参考指标。SLA 不仅明确了 AWS 对服务可用性的承诺,还规定了补偿机制,是企业评估业务连续性风险和设计高可用架构的重要依据。
在评估 AWS SLA 之前,企业应先考虑几个问题:
-
我希望使用的 AWS 服务正常运行时间是多少?
-
服务中断时,我能期待多快的响应?
-
我的应用程序可以容忍多长时间的停机?
-
服务中断会对业务造成什么影响?
-
AWS 未履行 SLA 承诺时,企业可获得哪些补偿?
AWS SLA 的概念与意义
SLA(Service Level Agreement) 是服务提供商与客户之间签署的协议,明确服务质量标准、可用性指标、响应时间和违约补偿等内容。
截至目前,AWS 为其众多服务发布了超过 173 项单独 SLA。不同服务的 SLA 在可用性承诺、补偿机制等方面各不相同,因此企业必须:
-
了解所使用服务的 SLA 细则
-
评估 SLA 与自身应用程序服务级别目标(SLO)的匹配度
-
评估 SLA 对客户体验和整体业务连续性的影响
SLA 提供参考和保障,但不能完全替代企业自身的高可用设计和监控措施。
主要 AWS 服务的 SLA Highlights
以下为企业常用服务的 SLA 摘要:
1. Amazon EC2(弹性计算)
-
SLA 承诺:99.99% 可用性(单实例 SLA 为 90%)
-
月度可允许停机时间:约 4.38 分钟
-
补偿机制:可申请服务信用,需提交故障日志及受影响资源信息
为实现 99.99% SLA,建议跨 多个可用区 部署应用程序。
2. Amazon RDS(关系型数据库)
-
多可用区部署 SLA:99.5% 可用性
-
月度可允许停机时间:约 3.65 小时
-
补偿机制:按月服务费比例申请服务信用
-
建议:对高可用需求,可使用 Amazon Aurora(99.99% SLA)或跨区域部署。
3. Amazon S3(对象存储)
-
SLA 承诺:大部分服务 99.9%,单区不频繁访问服务 99%
-
数据耐久性承诺:11 个 9(99.999999999%)
-
服务补偿:可按月正常运行时间比例申请服务信用
4. AWS 支持响应时间
AWS 支持计划响应时间与 SLA 本身无关,但对运维和故障处理至关重要:
| 严重程度 | 开发者 | 商业 | 企业 |
|---|---|---|---|
| 一般指导 | <24h | <24h | <24h |
| 系统受损 | 12h | 12h | 12h |
| 生产系统受损 | — | 4h | 4h |
| 生产系统崩溃 | — | — | <1h |
| 业务关键系统宕机 | — | — | <15min |
SLA 使用注意事项
-
SLA 不等于零停机保障
服务信用可能不足以弥补实际业务损失。 -
主动监控和日志管理
申请 SLA 补偿需提供日志佐证,企业需确保可观测性。 -
合理架构设计
跨可用区或多区域部署可以提升应用可用性,避免单点故障。 -
了解补偿流程
服务信用需主动申请,不会自动发放。
数据隐私与共享责任
在 AWS SLA 下,数据隐私仍是企业责任:
-
数据归客户所有,AWS 不会用于营销或广告
-
客户需管理访问权限、存储位置和加密方式
-
遵循 AWS 共享责任模型:AWS 负责基础设施安全,客户负责内容和应用安全
AWS代理商
作为 AWS 官方认证代理商,我们可以帮助企业:
-
理解不同服务的 SLA 及影响
-
设计高可用、弹性的云架构
-
协助申请 SLA 补偿
-
提供架构优化与落地支持
通过专业指导,企业能够充分利用 AWS SLA 保障业务连续性,降低云上风险。
总结
AWS SLA Agreement 为企业提供了可用性保障和补偿机制,但不能替代自身的高可用设计。企业应结合自身业务需求,制定可靠的监控、冗余和备份方案,确保云上业务安全、稳定、高效运行。
正确认识和使用 AWS SLA,是企业上云、保障业务连续性的关键步骤。

