Was ist Uptime und Downtime?

Im Allgemeinen spiegelt ein uptime-Wert einen Prozentsatz der Zeit wider, gemessen innerhalb der Grenzen eines bestimmten Zeitraums, in dem Dotcom-Monitor erfolgreiche Antworten von Überwachungs-Agenten auf der ganzen Welt. Der d-Eigenzeitwert gibt einen Prozentsatz der Zeit an, gemessen innerhalb der Grenzen eines angegebenen Zeitraums, in dem Dotcom-Monitor negative Antworten erhalten hat.

Manuelle Server-Uptime/Downtime-Prüfungen

Es gibt viele kostenlose kommerzielle und Open-Source-Tools und verfügbare Lösungen, mit denen Sie den Status und die Leistung Ihrer Webserver überprüfen können. Während diese Tools eignen sich hervorragend für die Überprüfung der Status, Reaktionszeit und Leistung zu diesem Zeitpunkt, um Tests manuell auszuführen, um die Für Serverfehler ist zeit- und ressourcenschonend und liefert Ihnen nur Ergebnisse zum Zeitpunkt des Tests. Erkennen von Fehlern während der Ausführung manueller Tests möglicherweise Auswirkungen auf Sier Clientsab ility auf den Zugriff auf Ihre Website und das Geschäft.

Automatisieren der Überwachung von Betriebs-/Ausfallzeiten

Serverprobleme können schwer zu lokalisieren sein und zeitaufwändig sein, um zu beheben, so dass die Zeit von derde Fehler auftreten. Ichf Sie keine automatisierte Überwachung für Ihre Server eingerichtet haben, und Fehler auftreten und ein Signifbis zur Entdeckung der Schaden möglicherweise bereits entstanden ist. Automatisieren des Servers Monitorund Proaktives Einrichten Uptime/downtime-Checks ermöglichen es Ihnen, kontinuierlich und automatisch set monitoRing checks and sofortige Benachrichtigungen erhalten, wenn Ausfallzeiten auftreten, so dass Ihre Teams Fehler schnell beheben undp Ihre Kunden from mit ein negativer Benutzer Erfahrung oder Risiko FansacialVerluste das Business.

Überwachung der Einhaltung von Service Level Agreements

Darüber hinaus kann die Überwachung der Betriebszeit dazu beitragen, dass Dienstanbieter ihre SLA (Service Level Agreement) einhalten. Verpflichtungen. Weitere Informationen zum SLA-BerichtIm Rahmen der Dotcom-Monitor-Lösung lesen Sie bitte unseren Knowledge Base-Artikel zum Erstellen von SLA-Berichten. Der SLA-Bericht ist eine spezielle Berichtsgruppe, die Ihnen eine einzelne Ansicht der SLA-Leistung über bestimmte Zeitintervalle bietet.

Wie definieren Sie Ausfallzeiten für Geschäftsanforderungen?

Mit these Faktoren im Auge, im Folgenden sind mehrere Beispiele Wenn überlegen, wie Sie Ausfallzeiten definieren.

  • Wenn Sie jeden Sonntagabend regelmäßig Wartungsarbeiten auf Ihrem Webserver geplant haben, ist Ihre Website dann nicht verfügbar?
  • Sie haben einen In-Chicago-basierten Web-Server kann nicht von Orlando erreicht werden, FL weilIhr Dienstanbieter hat ein Problem in Orlando, aber es ist aus dem Rest der Vereinigten Staaten verfügbar, ist Ihre Website aus?
  • Wenn ein gehostetes Element eines Drittanbieters,z. B. ein Chat-Widget, einen Serverfehler auftritt, der Rest Ihrer Website jedoch verfügbar ist, ist Ihre Website nicht verfügbar?
  • Wenn Ihre Website nicht von überall auf der Weltverfügbarist, aufgrund eines Server-Hickhacks oder eines anderen Serverfehlers, und dauert eslänger als 5 Sekunden, ist Ihre Website gesperrt?
  • Wenn Sie eine Einzelhandels-Website betreiben und der Warenkorbprozess ordnungsgemäß funktioniert, aber eine andere Seite, wie z. B. Ihre Seite Über uns, nicht geladen wird, ist Ihre Website nicht gesperrt?
  • Wenn einer Ihrer DNS-Servers ausfällt, aber drei weitere funktionieren, was25 Prozent der Clients entspricht,die nicht in der Lage sind, Nach Ablauf der zwischengespeicherten Time-to-Live (TTL) auf die Website zugreifen, wird sie als Down-Bedingung betrachtet?
  • Wenn einer von drei Webservern in einer Webfarm ausfällt und die Seitenantwortzeit um 10 Prozenterhöhtwurde, 25 Prozentoder sogar 50 Prozent langsamer Seitenladetime, wennSieberücksichtigen, wenn Ausfallzeiten auftreten?

Niemand mag es, mitten in der Nacht angerufen oder alarmiert zu werden, wenn Ernst Ausfallzeiten treten auf. Wenn die ersten Antworten auf Deigene Zeit bedeutete, um 2 a aufzuwachen.M. um das Problem anzugehen, Würde Alle Antworten auf die oben genannten Fragen ändern Ihre Überwachung Ansatz oder Reaktion in Bezug auf die Uptime und DEigenzeit?

Berechnungsansatz für Betriebszeit/Ausfallzeiten

Die Berechnung von Betriebs- oder Ausfallzeiten bietet eine Möglichkeit, sorgfältig zu definieren, wie die Dotcom-Monitor-Plattform Antworten entweder als “Up”- oder “Down”-Antworten interpretiert. Dies wird durch die Verwendung von Filtern erreicht. Mit Filtern können Sie bestimmte Bedingungen und Parameterfür die Überwachung von Gerätenwie Überwachungsdauer, Vorgangsfehler, Fehlercodes usw. , für die Überwachung von Agenten. Filter können auch verwendet werden, um zu definieren, wie Warnungen gesendet und empfangen werden, die Anzahl der Fehlalarmezu begrenzen oder zu ignorieren, die unbeabsichtigt ausgelöst werdenkönnten,um die Anforderungen Ihrer Geschäfts- und Überwachungsumgebung zu erfüllen.

Übrigens kann ein Filter auch auf ein Gerät (Schneiden von Falschauslösung) und auf jede Art von Berichterstellung angewendet werden.

Die Filterung definiert die Up/Down-Zustände anhand der folgenden einstellbaren Kriterien:

  • Der error wird für eine bestimmte Anzahl von Minuten gemeldet.
  • Der error wird durch eine angegebene Anzahl von Agentsbestätigt.
  • Der error wird in einer bestimmten Anzahl von Aufgaben erkannt.

Alle Filter und deren Einstellungen sind verfügbar, indem Sie Konfigurieren von > Filtern. Nachdem ein Filter auf ein Überwachungsgerät angewendet wurde, Benachrichtigungen basieren auf den Kriterien des Filters.

pro default filter wird allen neuen Überwachungs- Geräts. Der Standardfilter verfügt über eine ausgewogene Konfiguration und eignet sich für die meisten Geräts.

Berechnungen zur Betriebszeit/Ausfallzeit

Die mathematische Formel für die Ausfallzeitberechnung ist unten dargestellt.

Dauer der Ausfallzeit

Ausfallzeit Dauer ist direkt an die Konfigurationen innerhalb des Filters gebunden.

  • Die Ausfallzeit beginnt, wenn die Bedingungen eines Filters erfüllt sind. Wenn z. B. die Anzahl der Ein Gents, der einen Fehler meldet, entspricht der Anzahl der im Filter angegebenenA-Gents, und wie auch die angegebenen Bedingungen für die Anzahl der Minuten und Aufgaben erfüllt sind, wird eine Ausfallzeitwarnung gesendet.
  • Die Betriebszeit beginnt, wenn die Bedingungen des Filters nicht mehr erfüllt sind. Speziell Die Betriebszeit beginnt, wenn die Anzahl der A-Gents, Minuten oder Aufgaben, die “up”-Erfolg gemeldet haben nicht mehr die Bedingungen erfüllen, die für die gefilterten “Down”-Bedingungen erforderlich sind. Zum Beispiel ein “up” wird angezeigt, wenn die Anzahl der Fehlers,oder “Down”-Antworten , empfangen durch Überwachung EinGents wird kleiner als die Anzahl der Fehlers, oder “down”-Antworten , die einGents, wie im Filter festgelegt, benötigen, um eine “down”-Bedingung anzuzeigen.

Dauer eines nicht definierten Zustands

Ein nicht definierter Zustand kann festgelegt werden, wenn der Status jedes AGent, das an der Überwachung beteiligt ist, wird undefiniert. Ein Agentenstatus wird als undefiniert betrachtet, Nicht definiert, wenn A gent für einen bestimmten Zeitraumkeine Antwort, weder eine Fehlerantwort noch eine erfolgreiche Antwort, liefert.

Response Wait Time Duration = (Anzahl aller Agenten+1) × Überwachungshäufigkeit + 15 minutes

Wenn wir z. B. eine Situation in Betracht ziehen, in der wir drei Überwachungs- EinGents und eine Überwachungsfrequenz von alle 5 Minuten, each EinGent wartet 35 Minutenauf eine Antwort. Die Berechnung der Antwortwartezeitdauer wie folgt:

Response Wait Time Duration = (3+1) ×5 +15 minutes = 35 minutes

Nach Ablauf der Zeit und ohne Antwort meldet der Agent den Status Nicht definiert.

Dauer des aufgeschobenen Zustands

Aufschieben einer Überwachung Gerät stoppt jederzeit jede Überwachungsaktivität, bis sie wieder aktiviert wird.

Dauer, die nach Zeitplan ausgeschlossen wurde

Eine weitere Entität, die Uptime/Downtime-Berechnungen erheblich beeinflussen kann, Schedules. Schedules dienen als eine Option für die Verwaltung Ihrer Überwachung Agents Während Perioden der Routine oder scheDuled Wartung. Die Überwachung kann für bestimmte Wochentage verschoben werden, sowie bestimmte Stunden und Minuten während eines Tages. Um einen Zeitplan einzurichten, folgen Sie den Schritten in unserem Zeitplan, Konfigurieren eines Schedule Knowledge Base-Artikels.

Jede Änderung in einem Überwachung Geräts Einstellungs, Einschließlich Neustart eines Überwachung Gerät, während der Down wird der Status zurückgesetzt, sodass keine Betriebszeitwarnung gesendet wird.

Beispiel für Serverbetriebszeit/Ausfallzeit

Für ein Beispiel, wie ein Überwachungs-Agents prozessiert und mit einem Uptime- oder Ausfallzeitstatus reagiert, sagen wir, dass wir ein Überwachungsgerät haben, das von sieben Standorten aus überwacht wird, und es gibt einen Filtersatz, der drei Standorte einen Fehler melden muss, wenn eine Ausfallzeitbedingung erfüllt ist. Dieses Szenario ist in der folgenden Grafik dargestellt.

example_regular

Wie Sieaus dem obigen Diagramm sehen, Eine Überwachung Knoten (progent 1) erkennt einen Fehler, während der Rest der Agenten melden immer noch Erfolgeful-Antworten. nächster, ein zweiter Überwachungsknoten, Agent 2, Erkennt einen Fehler, auf die Fehlerantwort von einem Dritte und letzte Überwachungsknoten, Agent 4. Diese letzte Fehlerantwort an Punkt T4 im Diagramm, löst den Filter aus, um Downtime-Anfang direkt ab diesem Moment einzustellen.

Der Down-Zustand bleibt so lange bestehen, bis Sie einen Pos-Pon-E-Zeitraum festlegen.. In diesem Diagramm haben wir eine hypothetische Verschiebung gesetzt, die sich an Punkt T5 befindet, da die Anzahl der Agent s-Berichtsfehler den vordefinierten Schwellenwert von drei Überwachungsgeräten während der Dauer der Überwachung erreicht hat Sitzung.

Der Zeitabstand zwischen den Punkten T6 und T7 in der Grafik zeigt, dass die erste Antwort eine Verzögerung (Die Überwachungssitzungsverarbeitungszeit umfasst Verzögerungen bei der Netzwerkübertragung und die Ausführung selbst), so dass die “Verzögerte” Zeit als ∆ (T7–T5) berechnet wird (im Diagramm als Aufgeschoben 2nd ).

Hier einGewinn, fallen wir in Ausfallzeit nur auf den dritten Fehler von Agent 3 und setzen einen Uptime-Zustand nur auf der Punkt T9-Antwort, wenn die Anzahl der fehlerhaften Agenten kleiner wird als im Filter angepasst. Im Folgenden finden Sie die berechnungsformel für die endgültige Ausfallzeitprozentzahl für dieses Beispiel.

Überwachung von Betriebs- und Ausfallzeiten mit Dotcom-Monitor

Zur Automatisierung des Prozesses der Überwachung von Betriebs- und Ausfallzeiten, Sie müssen eine Lösung nutzen, die vollständige End-to-End-Transparenz in Infrastrukturumfangund Leistungbietet und Funktionenbereitstellt, wie die Möglichkeit, von mehreren globalen Standorten aus zu überwachen, bestimmte Zeitpläne, Filter, sofortige Warnungen zu konfigurieren, Berichteund Metriken und vielesmehr. All diese Funktionen geben den Anwendern die to den Anforderungen und Bedürfnissen ihres Unternehmens entsprechen. Tdie Dotcom-Monitor-Plattform bietet all diese grundlegenden Funktionen sowie erweiterte Konfigurationseinstellungen und Integrationen von Drittanbietern, die alle über ein einziges Dashboard verfügen. Erfahren Sie mehr über alle Überwachungslösungen von Dotcom-Monitor, um die Betriebszeit Ihrer Websites, APIs und Webanwendungen rund um die Uhr zu gewährleisten.