可用性計算機 – SLA稼働時間とダウンタイム

SLAまたはSLOに基づいて可用性とダウンタイムを計算します。可用性計算機とチートシートを使用して、時間、日、週、月、四半期、および年に基づくアップタイム/ダウンタイムデータを確認できます!

SRE、DevOps、およびエンジニアリングリーダーは、SLA と SLO を定義するために可用性目標を頼りにしています。このチートシートでは、90% から 99.999% までの可用性レベルごとにダウンタイムの許容値を分類しているため、計画、ベンチマーク、および期待値の伝達を明確に行うことができます。

アベイラビリティ・チートシート

可用性レベル 年間ダウンタイム 四半期ごとのダウンタイム 月間ダウンタイム 1週間のダウンタイム 1日あたりのダウンタイム 時間当たりのダウンタイム
90% 36.52日 9.12日 3.05日 16.79時間 2.39時間 6.01分
95% 18.25日 4.58日 1.52日 8.41時間 1.21時間 3.01分
99% 3.65日 21.92時間 7.31時間 1.69時間 14分41秒 36.00秒
99.5% 1.84日 10.97時間 3.65時間 50分41秒 7.21分 18.01秒
99.9% 8.77時間 2.20時間 43.84分 10分08秒 1分45秒 3.61秒
99.95% 4.39時間 1.10時間 21.92分 5分05秒 43秒21 1.80秒
99.99% 52分59秒 13.16分 4.39分 1.01分 8.65秒 0.37秒
99.999% 5.27分 1.32分 26.31秒 6.05秒 0.87秒 0.05秒

稼働率(%)


数学だけでなく実際のモニタリングが必要?

Dotcom-Monitorは、SREとDevOpsチームが稼働時間の目標を現実にするのを支援します。
リアルタイムのシンセティック・モニタリング、SLAトラッキング、グローバルなパフォーマンス・インサイト、これらすべてを1つのプラットフォームで実現します。

よくある質問SREのSLAと可用性

1) 本番環境で99.9%以上の稼働率目標は現実的か?
しかし、それは適切な可視性があれば可能です。多くのSLAでは、部分的な停止、地域的な遅延、または従来の監視をトリガーせずにユーザーエクスペリエンスに影響を与えるサードパーティの依存関係を見落としています。Dotcom-Monitor は、グローバルな外部チェックを使用してこれらのギャップを捕捉し、より正確で防衛可能なアップタイム数を提供します。

2) SLAを追跡するために、実際に何をモニターすればいいのか?
未加工の稼働時間に縛られたSLAでは意味がない。外部から見える指標を監視する:HTTPの成功、全ページのロード時間、DNSの解決、サードパーティの依存関係の健全性。Dotcom-Monitorはファイアウォールの外側から、実際のユーザーと同じようにこれらすべてを追跡します。

3) 社内のSLOと顧客向けのSLAをどのように整合させればよいですか?
インフ ラの健全性だけでなく、ユーザーエクスペリエンスを反映する SLIの測定から始める。そして、チームがサポートできるSLOに戻る。SLAはSLOより低い約束しかできませんが、その逆はできません。内部と外部の両方のビューを提供するツールは、ギャップを埋めるのに役立ちます。

4) 99.9%のアップタイムを超えることに意味はあるのか?
これはお客様の業界と稼働時間要件に依存します。Dotcom-Monitorは、サードパーティによる検証やアラート通知により、超高可用性の主張を検証します。

5) なぜクラウドプロバイダーのSLAに頼らないのか?
なぜなら、AWSの「スリーナイン」は、あなたのアプリがそれを満たすことを保証しないからだ。インフラレベルのSLAでは、アプリのバグやCDNの不調、DNSの設定ミスなどで可用性が損なわれる可能性があります。システム全体に責任を持たせるためには、外部からのチェックが必要だ。