Surveillance Caffeinated DNS et la panne AT&T DNS

Un article de Dotcom-Monitor »Caffeinated DNS Monitoring and the AT&T DNS Outage » publié sur SpeedAwarenessMonth.com concernant la panne du serveur de noms de domaine AT&T (DNS) du 15 août 2012 démontre pourquoi une méthode non mise en cache de surveillance DNS se traduit par un délai de réparation plus rapide (TTR), et même zéro temps d’arrêt en raison de la question DNS.

L’article complet est disponible à SpeedAwarenessMonth.com mais les bases comprennent:

AT&T DNS Problème de pannePour cache ou non-à-cache – c’est la question de surveillance DNS

Tout d’abord, il n’est généralement pas bien connu que la surveillance externe http site web de type demande, comme le café à votre joint java local, est disponible en différentes «grades» – basé sur le cache et non-cache basé. Dotcom-Monitor utilise une surveillance non mise en cache, qui se propage à travers le processus DNS complet à chaque instance de surveillance. La surveillance basée sur le cache (utilisée par de nombreux services de surveillance de base) ne se propage pas par le biais du processus DNS et manque les problèmes DNS.

Comment surveiller efficacement la prochaine situation de panne DNS

Dans le cas de la panne ATT DNS, plusieurs facteurs clés aident à accélérer le délai de réparation (TTR) ou à éviter les temps d’arrêt :

  • Méthode de détection des erreurs : Utilisez une solution de surveillance qui utilise une méthode non-cache pour propager les requêtes DNS jusqu’aux serveurs de nom racine à chaque instance de surveillance. Un service de méthode de cache cache cache DNS et ne détecte donc pas du tout un problème DNS secondaire, ou il peut prendre des jours, voire des semaines pour détecter le problème.
  • Fréquence de surveillance : Utilisez une fréquence plus rapide de surveillance non cache, comme toutes les 1 minute contre une fois par heure. Plus la solution de surveillance non cache détecte et alerte rapidement un administrateur touché d’un site Web à l’aide d’un service DNS défaillant, plus vite un commutateur peut être effectué vers un fournisseur de défaillance DNS.
  • Valeur du paramètre Time-to-Live (TTL) : plus la valeur du paramètre TTL utilisée par l’administrateur DNS est faible pour persister dans la mise en cache IP d’un domaine à partir du serveur de noms faisant autorité principal, plus vite l’échec vers un autre fournisseur DNS peut être implémenté. Généralement réglé à 86.400 secondes (1 jour) ou plus, dans la planification de récupération après sinistre le TTL peut être réglé aussi bas qu’une fois toutes les 300 secondes, mais plus le réglage plus la charge sur le serveur de nom de domaine faisant autorité.
  • Les diagnostics – tels qu’un tracé automatique au moment du problème détecté par le DNS – sont fournis par la solution de surveillance (gardez à l’esprit que de nombreux services de surveillance de base ne fournissent aucune information diagnostique).
  • Réparation : Continuez la surveillance pendant l’état d’erreur pour identifier davantage le problème. Envoyez les résultats surveillés à votre fournisseur DNS. Vous pouvez également exécuter gratuitement des itinéraires de traçabilité DNS manuels à www.dotcom-monitor.com/WebTools/trace.asp (sélectionnez Trace Style «DNS») pour vérifier le problème au besoin.
  • Prévenir : Gardez un œil sur les problèmes DNS « soft error », tels que les ralentissements DNS et les pannes intermittentes de DNS, afin que vous puissiez agir avant que l’« erreur douce » ne devienne une « erreur difficile » comme un client confronté à des temps d’arrêt.

Merci, je vais prendre le Caffeinated Double Depth Charge, Non-cached

Il est donc clair qu’une combinaison de non-cache et d’autres facteurs limitent l’exposition aux temps d’arrêt en raison de problèmes comme la panne AT T DNS du 15 août 2012. En outre, une méthode non mise en cache de surveillance DNS est un facteur critique dans un TTR plus rapide, et même zéro temps d’arrêt.

Enfin, il est important de se rappeler que TTR détermine la perte due aux temps d’arrêt. En d’autres termes, plus le temps total qu’il faut pour détecter, diagnostiquer et réparer un problème DNS, plus l’impact du problème DNS est grave. Inversement, plus une solution de surveillance accélère le TTR rapidement, plus la perte est réduite, ou complètement évitée.

Semblable à une bonne tasse forte de café caféiné une méthode non-cache peut faire la différence entre une journée d’arrêt et une journée productive rapide.

Pour en savoir plus sur la panne ATT DNS voir notre article, Doing DNS Monitoring Right: The ATT DNS Outage.

Latest Web Performance Articles​

Top 25 des outils de surveillance des serveurs

Dans cet article, nous donnons à nos experts des 25 meilleurs outils de surveillance des serveurs pour vous aider à surveiller la disponibilité de votre site Web et offrir à vos utilisateurs la meilleure expérience, en commençant par notre propre solution chez Dotcom-Monitor. Découvrez pourquoi la surveillance des serveurs est un élément essentiel de toute stratégie de surveillance.

Top 20 des outils de surveillance synthétique

La surveillance synthétique permet aux équipes de surveiller et de mesurer les performances des sites Web et des applications Web en permanence à partir de tous les points de vue imaginables, et de recevoir des alertes avant que les problèmes ne commencent à avoir un impact sur les utilisateurs réels. Voici nos meilleurs choix pour les outils de surveillance synthétique, en tête avec les nôtres chez Dotcom-Monitor.

Start Dotcom-Monitor for free today​

No Credit Card Required