可用性计算器 – SLA 正常运行时间和停机时间

根据您的 SLA 或 SLO 计算可用性和停机时间。使用我们的可用性计算器和小抄,查看基于小时、天、周、月、季度和年的正常运行时间/停机时间数据!

SRE、DevOps 和工程领导依赖可用性目标来定义 SLA 和 SLO。本小抄将从 90% 到 99.999% 的每个可用性级别的停机允许时间进行了细分,这样您就可以清晰地制定计划、基准和沟通预期。

可用性小册子

可用性级别 每年停机时间 每季度停机时间 每月停机时间 每周停机时间 每天停机时间 每小时停机时间
90% 36.52 天 9.12 天 3.05 天 16.79 小时 2.39 小时 6.01 分钟
95% 18.25 天 4.58 天 1.52 天 8.41 小时 1.21 小时 3.01 分钟
99% 3.65 天 21.92 小时 7.31 小时 1.69 小时 14.41 分钟 36.00 秒
99.5% 1.84 天 10.97 小时 3.65 小时 50.41 分钟 7.21 分钟 18.01 秒
99.9% 8.77 小时 2.20 小时 43.84 分钟 10.08 分钟 1.45 分钟 3.61 秒
99.95% 4.39 小时 1.10 小时 21.92 分钟 5.05 分钟 43.21 秒 1.80 秒
99.99% 52.59 分钟 13.16 分钟 4.39 分钟 1.01 分钟 8.65 秒 0.37 秒
99.999% 5.27 分钟 1.32 分钟 26.31 秒 6.05 秒 0.87 秒 0.05 秒

可用性百分比 (%)


需要真正的监控,而不仅仅是数学?

Dotcom-Monitor 帮助 SRE 和 DevOps 团队将正常运行时间目标变为现实。
在一个平台上实现实时合成监控、SLA 跟踪和全局性能洞察。

常见问题:SRE 的服务水平协议(SLA)和可用性

1) 在生产环境中,99.9% 以上的正常运行时间目标是否现实?
它们可以是,但前提是要有正确的可视性。许多 SLA 都忽略了部分中断、区域延迟或第三方依赖性,这些都会影响用户体验,而不会触发传统监控。Dotcom-Monitor 使用全局、外部检查来捕捉这些差距,为您提供更准确、更有说服力的正常运行时间。

2) 要跟踪 SLA,我究竟应该监控什么?
与原始正常运行时间挂钩的服务水平协议并不重要。监控外部可见指标:HTTP 成功率、完整页面加载时间、DNS 解析、第三方依赖性健康状况。Dotcom-Monitor 可以像真正的用户一样,从防火墙外跟踪所有这些指标。

3) 如何使我们的内部 SLO 与面向客户的 SLA 保持一致?
首先要衡量能反映用户体验的 SLI,而不仅仅是基础设施的健康状况。然后再回到您的团队能够支持的 SLO。SLA 的承诺可以低于 SLO,但不能相反。提供内部和外部视图的工具有助于缩小差距。

4) 正常运行时间超过 99.9% 还有意义吗?
这取决于您的行业和正常运行时间要求。如果您从事的是金融科技、医疗保健或任何事务性行业,Dotcom-Monitor 可通过第三方验证和警报帮助验证超高可用性要求。

5) 为什么不依赖云提供商的 SLA?
因为 AWS 提供的 “三个九 “并不能保证您的应用程序达到这个标准。基础设施层面的 SLA 并不能反映您的整个堆栈,应用程序的错误、CDN 的故障或 DNS 的错误配置都会影响可用性。您需要外部检查来对整个系统负责。