القيام بمراقبة DNS بشكل صحيح: انقطاع AT & T DNS

AT&T DNS Outageالقيام بمراقبة DNS بشكل صحيح: انقطاع AT & T DNS

يوضح انقطاع خادم اسم النطاق AT&T (DNS) في 15 أغسطس 2012 سبب أهمية طريقة “غير قائمة على ذاكرة التخزين المؤقت” لمراقبة مواقع الويب لمواقع الويب ذات المهام الحرجة. أولا ، قليلا من المراجعة. يتم إجراء الشكل الأساسي الأكثر شيوعا لمراقبة موقع الويب باستخدام متصفح اصطناعي (وليس متصفحا فعليا) ، والذي يتصل بالخادم المستهدف عبر عملية طلب HTTP. يتم التحقق من عدد من العمليات التي تركز على الخادم ، مثل توفر الخادم المستهدف ، والوقت المستغرق لتحميل ملف HTML لموقع الويب من الخادم ، والقدرة على اكتشاف الكلمات الرئيسية داخل ملف HTML عبر استخدام متصفح اصطناعي باستخدام عملية طلب HTTP.

لتخزين مؤقت أو عدم التخزين المؤقت – هذا هو السؤال

ومع ذلك ، فإن ما هو غير معروف بشكل عام عن منهجية مراقبة HTTP الاصطناعية الأساسية هو أن شركات مراقبة مواقع الويب لديها خيار – لاستخدام منهجية “ذاكرة التخزين المؤقت” أو “غير ذاكرة التخزين المؤقت”. اختيار المنهجية من قبل خدمة الرصد يؤثر بشكل مباشر على قدرته على اكتشاف المشكلات على خوادم DNS الثانوية ، مثل انقطاع AT&T DNS الذي حدث في 15 أغسطس 2012. من ناحية ، تعد الطريقة المستندة إلى ذاكرة التخزين المؤقت أبسط بكثير بالنسبة لأعمال المراقبة لتنفيذها وتكلف أقل للإعداد والإدارة. في الواقع ، تستخدم معظم خدمات مراقبة وقت التشغيل “الأساسية” منخفضة التكلفة “طريقة ذاكرة التخزين المؤقت”.

سآخذ غير ذاكرة التخزين المؤقت ، وذلك بفضل

ومع ذلك ، فإن السر الصغير القذر هو أن طريقة مراقبة ذاكرة التخزين المؤقت ليست دقيقة ، (ولا على المدى الطويل فعالة من حيث التكلفة) مثل حل غير ذاكرة التخزين المؤقت. لماذا؟ السبب البسيط هو أن الطرق المستندة إلى ذاكرة التخزين المؤقت لن تكتشف حتى مشكلة DNS الثانوية.

السبب الأكثر تعقيدا قليلا هو أطول ، لكنه في الحقيقة يحصل على ما يدور حوله الرصد الجيد – تجنب وقت التوقف.

على وجه التحديد ، السبب في أن عدم وجود ذاكرة تخزين مؤقت أكثر فعالية من حيث التكلفة هو أنه عندما تحدث مشكلة مثل انقطاع AT&T DNS دائما – كما هو الحال عند حدوث أي حالة خطأ في موقع الويب – إنه إجمالي وقت الإصلاح (TTR) الذي يحدد الخسارة بسبب وقت التوقف. وبعبارة أخرى ، فإن إجمالي الوقت (1) الذي يستغرقه اكتشاف الخطأ وتشخيصه وإصلاحه كلما كان تأثير الخطأ أسوأ. على العكس من ذلك ، كلما كان حل المراقبة أسرع في تسريع TTR كلما تم تقليل الخسارة (أو تجنبها تماما).

كيفية المراقبة الفعالة لحالة انقطاع DNS التالية في AT & T DNS

في حالة مشكلة انقطاع AT&T DNS ، هناك العديد من العوامل الرئيسية التي تحدد وقت الإصلاح:

– طريقة اكتشاف الأخطاء: استخدم حل مراقبة يستخدم طريقة غير ذاكرة التخزين المؤقت لنشر استعلامات DNS على طول الطريق إلى خوادم أسماء الجذر مع كل مثيل مراقبة. تقوم خدمة طريقة ذاكرة التخزين المؤقت بتخزين DNS مؤقتا وبالتالي لن تكتشف مشكلة DNS ثانوية على الإطلاق، أو قد يستغرق الأمر أياما أو أسابيع للكشف عن المشكلة.

-تردد المراقبة: استخدم ترددا أسرع للمراقبة غير ذاكرة التخزين المؤقت ، مثل كل 1 دقيقة مقابل مرة واحدة في الساعة. كلما كان حل المراقبة غير المؤقت أسرع في اكتشاف وتنبيه مسؤول متأثر بموقع ويب باستخدام خدمة DNS فاشلة ، كلما كان من الممكن إجراء تبديل أسرع إلى موفر تجاوز فشل DNS.

– إعداد تكرار وقت العمل (TTL): كلما كانت قيمة إعداد تردد وقت البث المباشر (TTL) أصغر الذي يستخدمه مسؤولو DNS لتعيين التخزين المؤقت لنظام أسماء النطاقات إلى خادم DNS ثانوي لاسم المجال من خادم الاسم الموثوق به الأساسي. عادة ما يتم تعيينها إلى 86,400 ثانية (1 يوم) أو أكثر ، في التخطيط للتعافي من الكوارث ، يمكن تعيين TTL مرة واحدة كل 300 ثانية ، ولكن كلما انخفض الإعداد ، زاد الحمل على خادم اسم المجال الموثوق.

-يتم توفير التشخيص – مثل مسار التتبع التلقائي في وقت اكتشاف مشكلة DNS – بواسطة حل المراقبة (لا توفر معظم خدمات المراقبة الأساسية أي معلومات تشخيصية)

-إصلاح: استمر في مراقبة الحل أثناء حالة الخطأ لتحديد المشكلة بشكل أكبر. أرسل النتائج التي تمت مراقبتها إلى موفر DNS. يمكنك أيضا تشغيل مسارات تتبع DNS اليدوية المجانية هنا (حدد نمط التتبع “DNS”) للتحقق من المشكلة حسب الحاجة.

-منع: استخدم حل مراقبة يسمح لك بعرض تفاصيل بحث DNS (مثل مراقبة المتصفح الفعلية) من أجل رؤية “الأخطاء الناعمة” مثل الاتجاهات البطيئة والمشكلات المتقطعة ، حتى تتمكن من اتخاذ إجراء قبل أن يصبح “الخطأ الناعم” “خطأ فادحا” مثل العميل الذي يواجه وقت التوقف.

(1) وفقا للمنظمات التي شاركت في دراسة أجرتها لجنة الحقيقة والمصالحة، في أيلول/سبتمبر 2011، حددت المنظمات مقدار الوقت الذي تقضيه في استكشاف مشكلات الأداء وإصلاحها باعتباره التحدي الأكبر الذي تواجهه “في المتوسط، على مدى أسبوع عمل كامل من ساعات العمل (46.2 ساعة) التي تقضيها في مواقف غرف الحرب كل شهر”.

 

 

 

أحدث مقالات أداء الويب

دليل شامل لحل مراقبة DNS من Dotcom-Monitor

مقدمة: أهمية DNS في النظام البيئي الرقمي اليوم في عالم اليوم الرقمي ، يعتمد نجاح الأعمال التجارية عبر الإنترنت بشكل كبير على بنية تحتية قوية.

ابدأ تشغيل Dotcom-Monitor مجانا اليوم

بطاقة الائتمان غير مطلوبة