ما هو مهندس موثوقية الموقع (SRE)؟

مهندس موثوقية الموقع ، أو SRE ، هو دور يشمل جوانب كل من هندسة البرمجيات والعمليات / البنية التحتية. كما أنه يشمل استراتيجية ومجموعة من الممارسات والمبادئ عبر عروض الخدمات ويرتبط ارتباطا وثيقا ب DevOps والعمليات. ظهر مصطلح هندسة موثوقية الموقع لأول مرة في Google في عام 2003 عندما تم إنشاء فريق موثوقية الموقع. في ذلك الوقت ، كان الفريق يتكون من مهندسي البرمجيات. منذ ذلك الحين ، تطور مفهوم هندسة موثوقية الموقع وشق طريقه إلى صناعة تطوير البرمجيات الأوسع نطاقا وهو الآن دوره الخاص داخل المنظمات.

يقوم مهندسو موثوقية الموقع بسد الفجوة بين العمليات ومطوري البرمجيات. على الرغم من عدم وجود نهج واحد يناسب جميع النهج لما يفعله مهندس موثوقية الموقع من منظمة إلى أخرى ، بشكل عام ، يمكن أن تشمل مسؤولية مهندس موثوقية الموقع مجموعة واسعة من الأهداف ، مثل إدارة ومراقبة توافر النظام ، والكمون ، والأداء ، والكفاءة ، والاستجابة للحوادث ، وكذلك تخطيط القدرات لخدمات المنظمة. دعونا نتعمق في هذا الأمر لفهم المزيد عن هذا الدور وكيف يعمل داخل المنظمات.

 

ما هي هندسة موثوقية الموقع؟

للتفكير في الأمر بطريقة أخرى ، فإن هندسة موثوقية الموقع هي المكان الذي يلتقي فيه دور تكنولوجيا المعلومات التقليدي ، أو دور إدارة النظام ، و DevOps. في بيئة تكنولوجيا المعلومات التقليدية ، قد يكون لدى المؤسسات فريق من مسؤولي النظام الذين يديرون الأنظمة المعقدة. وينصب التركيز والمسؤولية على ضمان نشر البرمجيات بشكل صحيح وتقديم خدمة موثوقة للمستخدمين النهائيين. علاوة على ذلك ، يتضمن دورهم إدارة أي مشكلات أو تحدث بعد نشر البرامج.

ومع ذلك ، لا يركز مسؤولو النظام على تطوير البرامج الفعلي ، وهو المكان الذي يمكن أن تكون فيه أدوار التطوير ومسؤول النظام على خلاف. يركز المطورون على إنتاج البرامج ووضعها في أيدي المستخدمين ، وليس بالضرورة قلقين بشأن جوانب أو آثار نشر البرامج. عند هذا التقاطع يأتي دور مهندس موثوقية الموقع. يركز مهندسو موثوقية الموقع على إنشاء أنظمة برمجية قابلة للتطوير وموثوقة ، لذلك يشمل ذلك أيضا ضمان أن تكون أعمال التطوير فعالة وموثوقة ، لذلك عندما يكون المنتج النهائي جاهزا للإنتاج ، لا توجد مفاجآت.

 

ماذا يفعل مهندس موثوقية الموقع؟

تتضمن هندسة موثوقية الموقع تقسيم الوقت بين العمليات والتطوير. على سبيل المثال ، قد يشارك مهندس موثوقية الموقع في تذاكر مكتب المساعدة ، والحوادث عند الطلب ، والمهام اليدوية ، وما إلى ذلك. بالإضافة إلى ذلك ، قد يقضي مهندس موثوقية الموقع أيضا وقته في مشاريع استباقية ، مثل الأتمتة ، وتحسين موثوقية النظام ، وما إلى ذلك ، في محاولة لتقليل مقدار العمل اليدوي وضمان تشغيل جميع المكونات (البنية التحتية / الأجهزة ، والبرامج الوسيطة ، والبرامج ، وما إلى ذلك) المطلوبة للحفاظ على عمليات نشر البرامج حية بكفاءة.

 

ما هي بعض مسؤوليات SRE الشائعة؟

تختلف مسؤوليات SRE الفعلية من شركة إلى أخرى ، ولكن بالنسبة للجزء الأكبر ، يكون فريق SRE أو SRE مسؤولا عن جميع جوانب عروض خدماتهم ، وقد يتطلب واحدا أو كل أو أكثر من المسؤوليات التالية المدرجة أدناه:

  • تخطيط القدرات
  • توافر
  • اداء
  • رصد
  • الاستجابة للحوادث
  • الدعم عند الطلب
  • ما بعد الوفاة

لذلك ، كما ترون ، يميل دور SRE إلى أن يكون جاك لجميع الصفقات. في إحدى الدقائق ، قد تقوم SRE بتوفير التخزين في AWS ، وفي الدقيقة التالية قد تضطر SRE إلى التحدث إلى العملاء أو الذهاب لكتابة بعض تعليمات Python البرمجية لمشروع جديد. ذلك يعتمد حقا على اليوم.

 

ما هي الأدوات التي تستخدمها SREs؟

الأدوات والحلول البرمجية التي يمكن أن يختلف مهندسو موثوقية الموقع اختلافا كبيرا من مؤسسة إلى أخرى. ويتمثل أحد الأسباب الرئيسية في أنه في المنظمات الكبيرة، عادة ما يكون هناك المزيد من الموظفين داخل فريق SRE، وبالتالي، سيتم تقسيم مسؤوليات ونطاق كل SRE بين الفريق، مما يؤدي إلى دور أكثر تركيزا. وهذا بدوره من شأنه أن يقلل أيضا من نطاق الأدوات والمنصات التي سيستخدمونها. لذلك ، على سبيل المثال ، في مؤسسة أكبر ، قد تعمل SRE فقط في Jenkins طوال اليوم ، كل يوم.

على الجانب الآخر ، قد يضطر فريق هندسة موثوقية الموقع أو الفرد في مؤسسة أصغر إلى ارتداء العديد من القبعات الأخرى ، حيث من المحتمل أن يكون الموظفون محدودين ، وبالتالي ، يجب أن تتضمن مجموعة أدواتهم كل شيء بدءا من منصات إدارة التكوين وأنظمة الاستجابة الآلية للحوادث إلى أدوات المراقبة والتحليلات. قد تكون بالفعل على دراية ببعض الأدوات التي يستخدمها SRE ، مثل Docker و Terraform و Prometheus و Kibana.

اقرأ: أفضل 13 أداة لمهندس موثوقية الموقع (SRE)لمعرفة المزيد حول الأدوات الأكثر شيوعا التي يستخدمها مهندسو موثوقية الموقع اليوم.

 

أين يمكنني معرفة المزيد عن هندسة موثوقية الموقع؟

ينسب مصطلح “مهندس موثوقية الموقع” إلى بن ترينور سلوس ، الذي يشغل الآن منصب نائب رئيس الهندسة في Google. طلب منه في عام 2003 إنشاء وإدارة فريق من سبعة مهندسين مما أدى به في النهاية إلى إنشاء الدور / اللقب الجديد. هناك عدد قليل من الموارد الرائعة عبر الإنترنت التي كتبها Ben والعديد من أعضاء فريق Google الهندسي الآخرين والتي تغطي كل شيء بدءا من مبادئ ومبادئ SREs وأدوار SRE ومسؤولياتها ، إلى تطور دور هندسة موثوقية الموقع وأين يقف في بيئات DevOps اليوم. لا توجد طريقة أفضل لمعرفة المزيد عن هندسة موثوقية الموقع من الفرد والمنظمة التي أنشأت الدور في المقام الأول ، أليس كذلك؟

هناك أيضا قائمة كبيرة من موارد هندسة موثوقية الموقع الموجودة على GitHub.

 

الاستنتاج: ما هو مهندس موثوقية الموقع (SRE)؟

كما قمنا بتغطيتنا ، فإن SRE هو أكثر من مجرد عملياتك التقليدية أو دور مسؤول النظام. يستخدم SRE اتساع خبرته ومعرفته للمساعدة في أتمتة وإنشاء كفاءات عبر خدمات البرامج والمؤسسة. SRE الجيد هو شخص ، إلى حد كبير ، حلال ممتاز للمشكلات. ليس بالضرورة أن يكونوا خبراء في كل ما يفعلونه ، ولكن يجب أن يكون لديهم فهم للعديد من التخصصات المختلفة ومعرفة الخطوات والتقنيات التي يجب تنفيذها عند ظهور القضايا. كما يتعين عليهم أن يفهموا كيف تعمل الأدوار المختلفة داخل منظمتهم معا من أجل تنفيذ المهام والمشاريع بفعالية. إنه يشبه وضع لغز كبير ومعقد باستمرار. قد يكون الأمر محبطا للغاية ومتطلبا في بعض الأحيان ، ويمكن أن تفقد القطع في بعض الأحيان ، ولكن بمجرد الانتهاء منها ، هناك قدر كبير من الفخر والإنجاز.

وكجزء من مسؤولية نظام الإبلاغ الاستراتيجي، يشكل الرصد وإمكانية الملاحظة عنصرا رئيسيا في واجباتهم. تسمح حلول المراقبة الاصطناعية من Dotcom-Monitor لفرق SREs و DevOps بمحاكاة المستخدمين ومراقبتهم من خلال نظام أو خدمة. تسمح منصة Dotcom-Monitor ل SREs بإعداد تنبيهات مراقبة مخصصة وتتكامل مع منصات الحوادث والتنبيه مثل PagerDuty و VictorOps و AlertOps وغيرها الكثير. علاوة على ذلك ، يمكن ل SREs عرض لوحات المعلومات في الوقت الفعلي والوصول إلى التقارير ومراجعة التحليلات لتحديد مشكلات الأداء بسرعة. من الأهمية بمكان أن تراقب SREs والفرق باستمرار صحة التطبيقات والبنية التحتية لضمان فهم الموثوقية وإمكانية الوصول والأداء العام لبنيتها التحتية.

تعرف على المزيد حول Dotcom-Monitor وكيف يمكنك استخدام النظام الأساسي للتعمق في المراقبة وإمكانية الملاحظة للحصول على رؤية أفضل للتطبيقات والبنية التحتية الخاصة بك.

 

Latest Web Performance Articles​

Start Dotcom-Monitor for free today​

No Credit Card Required