Monitoreo de DNS con cafeína y la interrupción de DNS de AT&T

Un artículo de Dotcom-Monitor »Monitoreo de DNS con cafeína y la interrupción de DNS de AT&T» publicado en SpeedAwarenessMonth.com sobre la interrupción del servidor de nombres de dominio (DNS) de AT&T del 15 de agosto de 2012 demuestra por qué un método no almacenado en caché de monitoreo de DNS da como resultado un tiempo de reparación (TTR) más rápido e incluso cero tiempo de inactividad debido al problema de DNS.

El artículo completo está disponible en SpeedAwarenessMonth.com sin embargo, los conceptos básicos incluyen:

Problema de interrupción de DNS de AT&TTo Cache or Not-to-Cache – esa es la pregunta de monitoreo de DNS

En primer lugar, generalmente no es bien conocido que el monitoreo de sitios web de tipo solicitud HTTP basado en externa, como el café en su articulación java local, viene en diferentes «grados»: basado en caché y no basado en caché. Dotcom-Monitor emplea monitoreo no caché, que se propaga a través del proceso completo de DNS con cada instancia de monitoreo. La supervisión basada en caché (utilizada por muchos servicios de supervisión básicos) no se propaga a través del proceso DNS y pasa por alto los problemas de DNS.

Cómo monitorear eficazmente la próxima situación de interrupción de DNS

En el caso del problema de interrupción de DNS de AT&T, hay varios factores clave que ayudan a acelerar el tiempo de reparación (TTR) o evitar el tiempo de inactividad:

  • Método de detección de errores: use una solución de supervisión que utilice un método que no sea de caché para propagar consultas DNS hasta los servidores de nombres raíz con cada instancia de supervisión. Un servicio de método de caché almacena en caché DNS y, por lo tanto, no detectará un problema de DNS secundario en absoluto, o puede tardar días o incluso semanas en detectar el problema.
  • Frecuencia de supervisión: utilice una frecuencia más rápida de supervisión sin caché, como cada 1 minuto en lugar de una vez por hora. Cuanto más rápido detecte y alerte la solución de supervisión sin caché a un administrador afectado de un sitio web que utiliza un servicio DNS defectuoso, más rápido se podrá realizar un cambio a un proveedor de conmutación por error de DNS.
  • Valor de la configuración de tiempo de vida (TTL): cuanto menor sea el valor de la configuración TTL utilizada por el administrador de DNS para conservar el almacenamiento en caché de IP del dominio de un dominio desde el servidor de nombres autoritativo principal, más rápido se podrá implementar la conmutación por error a otro proveedor de DNS. Normalmente establecido en 86.400 segundos (1 día) o más, en la planificación de recuperación ante desastres, el TTL se puede establecer tan bajo como una vez cada 300 segundos, sin embargo, cuanto menor sea la configuración, mayor será la carga en el servidor de nombres de dominio autoritativo.
  • Los diagnósticos, como una ruta de seguimiento automática en el momento del problema de DNS detectado, son proporcionados por la solución de monitoreo (tenga en cuenta que muchos servicios básicos de monitoreo no proporcionan ninguna información de diagnóstico).
  • Reparar: continúe supervisando durante la condición de error para identificar aún más el problema. Envíe los resultados supervisados a su proveedor de DNS. También puede ejecutar rutas de seguimiento de DNS manuales gratuitas en www.dotcom-monitor.com/WebTools/trace.asp (seleccione Estilo de seguimiento «DNS») para verificar el problema según sea necesario.
  • Prevenir: Vigile los problemas de DNS de «error suave», como las ralentizaciones de DNS y las interrupciones intermitentes de DNS, para que pueda tomar medidas antes de que el «error suave» se convierta en un «error grave», como un cliente que enfrenta un tiempo de inactividad.

Gracias, tomaré la carga de doble profundidad con cafeína, sin caché

Está claro entonces que una combinación de factores que no son de caché y otros limitan la exposición al tiempo de inactividad debido a problemas como la interrupción de DNS de AT&T del 15 de agosto de 2012. Además, un método no almacenado en caché de monitoreo de DNS es un factor crítico para un TTR más rápido e incluso un tiempo de inactividad cero.

Finalmente, es importante recordar que TTR determina la pérdida debido al tiempo de inactividad. En otras palabras, cuanto más tiempo total se tarde en detectar, diagnosticar y reparar un problema de DNS, peor será el impacto del problema de DNS. Por el contrario, cuanto más rápido una solución de monitoreo acelera el TTR, más se reduce la pérdida o se evita por completo.

Similar a una buena taza fuerte de café con cafeína, un método sin caché puede marcar la diferencia entre un día de inactividad y un día productivo rápido.

Para obtener más información sobre la interrupción de DNS de AT&T, consulte nuestro artículo, Doing DNS Monitoring Right: The AT&T DNS Outage.

Latest Web Performance Articles​

Las 25 mejores herramientas de supervisión de servidores

En este artículo, ofrecemos nuestras selecciones de expertos de las 25 mejores herramientas de monitoreo de servidores para ayudar a monitorear el tiempo de actividad de su sitio web y brindar a sus usuarios la mejor experiencia, comenzando con nuestra propia solución en Dotcom-Monitor. Descubra por qué la supervisión de servidores es una parte esencial de cualquier estrategia de supervisión.

Las 20 mejores herramientas de monitoreo sintético

El monitoreo sintético permite a los equipos monitorear y medir el rendimiento del sitio web y las aplicaciones web durante todo el día desde todos los puntos de vista imaginables, y recibir alertas antes de que los problemas comiencen a afectar a los usuarios reales. Aquí están nuestras mejores opciones para herramientas de monitoreo sintético, liderando con las nuestras en Dotcom-Monitor.

Start Dotcom-Monitor for free today​

No Credit Card Required