{"id":32295,"date":"2026-01-05T13:19:19","date_gmt":"2026-01-05T13:19:19","guid":{"rendered":"https:\/\/www.dotcom-monitor.com\/blog\/website-monitoring-best-practices\/"},"modified":"2026-05-31T21:25:33","modified_gmt":"2026-05-31T21:25:33","slug":"website-monitoring-best-practices","status":"publish","type":"post","link":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/website-monitoring-best-practices\/","title":{"rendered":"Meilleures pratiques de surveillance de sites Web r\u00e9ellement utilis\u00e9es par les ing\u00e9nieurs"},"content":{"rendered":"<figure id=\"attachment_33991\" aria-describedby=\"caption-attachment-33991\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-33991\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices.webp\" alt=\"Operations engineer reviewing a global website monitoring dashboard with regional checkpoints, latency timelines, and active alerts\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33991\" class=\"wp-caption-text\">Une bonne surveillance vous indique ce qui a cass\u00e9, o\u00f9 et pourquoi, avant que vos clients ne le d\u00e9couvrent.<\/figcaption><\/figure>\n<p>La plupart des \u00e9quipes disposent de la surveillance de site web. Beaucoup moins ont une surveillance qui d\u00e9tecte r\u00e9ellement les probl\u00e8mes avant les clients, les ventes et le support. L\u2019\u00e9cart ne vient que rarement de l\u2019outil. Il r\u00e9side dans les pratiques qui l\u2019entourent : ce qui est contr\u00f4l\u00e9, d\u2019o\u00f9, \u00e0 quelle fr\u00e9quence, ce qui d\u00e9clenche une alerte, et qui d\u00e9cide quand une v\u00e9rification est d\u00e9faillante par rapport \u00e0 quand le site est d\u00e9faillant.<\/p>\n<p>Ce playbook rassemble huit meilleures pratiques de surveillance de site web qui distinguent les configurations approuv\u00e9es par les \u00e9quipes SRE et DevOps de celles qui se transforment silencieusement en bruit. Chacune est concr\u00e8te : seuils, intervalles, antipatterns, et ce qu\u2019il faut continuer \u00e0 faire une fois que \u00e7a fonctionne. Les m\u00eames pratiques s\u2019appliquent que vous surveilliez la disponibilit\u00e9 d\u2019un site marketing ou que vous effectuiez une surveillance synth\u00e9tique compl\u00e8te des transactions sur un SaaS.<\/p>\n<h2 id='\u00e0-quoi-ressemble-une-bonne-surveillance-et-pourquoi-la-plupart-des-configurations-la-manquent'  id=\"boomdevs_1\">\u00c0 quoi ressemble une \u00ab Bonne \u00bb surveillance (et pourquoi la plupart des configurations la manquent)<\/h2>\n<p>Une d\u00e9finition op\u00e9rationnelle : votre surveillance est bonne si votre \u00e9quipe apprend chaque probl\u00e8me visible par le client via un moniteur avant que vos clients ne le remarquent, et si les alertes que vous recevez sont presque toujours exploitables. Voil\u00e0 tout le crit\u00e8re.<\/p>\n<p>Trois chiffres permettent de suivre cette performance. Le temps moyen de d\u00e9tection (MTTD) indique si la surveillance est assez rapide. Le temps moyen de r\u00e9solution (MTTR) indique si les donn\u00e9es fournies par le moniteur suffisent pour r\u00e9soudre le probl\u00e8me. La pr\u00e9cision des alertes \u2013 le pourcentage d\u2019alertes qui \u00e9taient r\u00e9elles et n\u00e9cessitaient une action imm\u00e9diate \u2013 indique si votre \u00e9quipe fera encore confiance aux alertes dans six mois. La plupart des \u00e9quipes SRE mesurent le MTTD et le MTTR. La plupart des \u00e9quipes ne mesurent pas la pr\u00e9cision. C\u2019est pourquoi de nombreuses rotations de garde se d\u00e9gradent en reconnaissances silencieuses et en impuissance acquise.<\/p>\n<p>Le reste de ce playbook vise \u00e0 faire avancer ces deux chiffres dans la bonne direction simultan\u00e9ment.<\/p>\n<h2 id='superposez-les-v\u00e9rifications-sur-l-int\u00e9gralit\u00e9-du-chemin-de-la-requ\u00eate'  id=\"boomdevs_2\">Superposez les v\u00e9rifications sur l\u2019int\u00e9gralit\u00e9 du chemin de la requ\u00eate<\/h2>\n<p>Un seul contr\u00f4le HTTPS est un d\u00e9tecteur de fum\u00e9e avec un seul capteur. Il vous dit qu\u2019il y a un probl\u00e8me, mais pas o\u00f9. Quand un utilisateur tape votre URL et attend le rendu de la page, la requ\u00eate traverse au moins six couches : r\u00e9solution DNS, handshake TCP, n\u00e9gociation TLS, r\u00e9ponse HTTP, chargement des ressources, et rendu c\u00f4t\u00e9 client de la vue finale. Chaque couche \u00e9choue diff\u00e9remment et chaque \u00e9chec vient d\u2019une cause racine distincte.<\/p>\n<figure id=\"attachment_33977\" aria-describedby=\"caption-attachment-33977\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img decoding=\"async\" class=\"size-full wp-image-33977\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack.webp\" alt=\"Diagram of the layered website monitoring stack from DNS to transaction, with each layer mapped to its failure mode and recommended check type\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33977\" class=\"wp-caption-text\">Une v\u00e9rification par couche. Chaque couche a une surface d&#8217;\u00e9chec distincte et une correction sp\u00e9cifique.<\/figcaption><\/figure>\n<p>La configuration pratique ressemble \u00e0 ceci :<\/p>\n<ul>\n<li><strong>DNS :<\/strong> V\u00e9rifiez que les enregistrements A, AAAA, CNAME et MX se r\u00e9solvent aux valeurs attendues depuis plusieurs r\u00e9solveurs. Les probl\u00e8mes DNS sont les plus faciles \u00e0 manquer et les plus difficiles \u00e0 d\u00e9boguer apr\u00e8s coup. Les <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/meilleurs-outils-de-surveillance-dns\/\">meilleurs outils de surveillance DNS<\/a> surveillent les modifications non autoris\u00e9es, les d\u00e9lais de propagation et les \u00e9checs sp\u00e9cifiques aux r\u00e9solveurs.<\/li>\n<li><strong>TCP et ICMP :<\/strong> Confirmez que le port est ouvert et que le chemin r\u00e9seau est sain. Un changement de pare-feu qui bloque le port 443 ne sera pas d\u00e9tect\u00e9 par une v\u00e9rification HTTP depuis le m\u00eame segment r\u00e9seau.<\/li>\n<li><strong>TLS :<\/strong> Validez la cha\u00eene de certificats, la date d\u2019expiration, la correspondance du nom d\u2019h\u00f4te et le support des chiffrement. La plupart des pannes de certificat sont \u00e9vitables \u2013 le certificat vient juste d\u2019expirer un dimanche. Obtenez des alertes explicites \u00e0 60, 30, 14 et 3 jours. Voir <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/monitor-ssl-certificate-expiration\/\">comment surveiller l\u2019expiration des certificats SSL<\/a> pour les d\u00e9tails de configuration.<\/li>\n<li><strong>HTTP :<\/strong> Code d\u2019\u00e9tat, temps de r\u00e9ponse, et assertion de contenu. Un statut 200 avec un corps vide est une v\u00e9rification \u00e9chou\u00e9e, pas r\u00e9ussie.<\/li>\n<li><strong>Rendu et transaction :<\/strong> Faites passer un vrai navigateur par le parcours utilisateur, v\u00e9rifiez un \u00e9l\u00e9ment connu dans l\u2019\u00e9tat final, et mesurez le temps jusqu\u2019\u00e0 l\u2019interaction. La <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/what-is-synthetic-monitoring\/\">surveillance synth\u00e9tique<\/a> avec de vrais navigateurs d\u00e9tecte ce que le contr\u00f4le des protocoles ne peut pas \u2014 JavaScript cass\u00e9, scripts tiers qui bloquent, un fichier CSS manquant qui rend le bouton panier invisible.<\/li>\n<li><strong>API :<\/strong> Traitez les API comme des points de terminaison de premi\u00e8re classe. Un site qui charge mais ne peut pas finaliser un achat parce que l\u2019API de paiement est en timeout est toujours en panne. La <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/what-is-api-monitoring\/\">surveillance d\u2019API<\/a> m\u00e9rite son propre calendrier de v\u00e9rifications, s\u00e9par\u00e9 des pages qui en d\u00e9pendent.<\/li>\n<\/ul>\n<p>Quand quelque chose casse, la couche qui alerte en premier est votre point de d\u00e9part pour la cause racine. Une \u00e9quipe qui surveille uniquement HTTP n\u2019obtient qu\u2019une seule information : indisponible. Une \u00e9quipe qui surveille les six couches obtient un arbre des d\u00e9faillances.<\/p>\n<h2 id='faites-fonctionner-la-surveillance-synth\u00e9tique-et-rum-c\u00f4te-\u00e0-c\u00f4te-pas-l-un-\u00e0-la-place-de-l-autre'  id=\"boomdevs_3\" id=\"synthetic-rum\">Faites fonctionner la surveillance synth\u00e9tique et RUM c\u00f4te \u00e0 c\u00f4te, pas l\u2019un \u00e0 la place de l\u2019autre<\/h2>\n<p>Les deux m\u00e9thodes r\u00e9pondent \u00e0 des questions diff\u00e9rentes et ne sont pas substituables. Le tableau ci-dessous r\u00e9sume la r\u00e9partition choisie par la plupart des \u00e9quipes apr\u00e8s une p\u00e9riode de test de trois mois.<\/p>\n<div class=\"table-wrap\">\n<table>\n<thead>\n<tr>\n<th>Capacit\u00e9<\/th>\n<th>Surveillance Synth\u00e9tique<\/th>\n<th>Surveillance Utilisateur R\u00e9el (RUM)<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Source des donn\u00e9es<\/td>\n<td>Contr\u00f4les script\u00e9s depuis des emplacements contr\u00f4l\u00e9s<\/td>\n<td>Navigateurs des vrais visiteurs<\/td>\n<\/tr>\n<tr>\n<td>Fonctionne sans trafic<\/td>\n<td>Oui<\/td>\n<td>Non<\/td>\n<\/tr>\n<tr>\n<td>Base de r\u00e9f\u00e9rence coh\u00e9rente<\/td>\n<td>Oui \u2013 m\u00eame script, m\u00eames emplacements<\/td>\n<td>Non \u2013 varie avec le mix de trafic<\/td>\n<\/tr>\n<tr>\n<td>D\u00e9tecte les r\u00e9gressions avant les utilisateurs<\/td>\n<td>Oui<\/td>\n<td>Non<\/td>\n<\/tr>\n<tr>\n<td>Refl\u00e8te la diversit\u00e9 r\u00e9elle des appareils et r\u00e9seaux<\/td>\n<td>Limit\u00e9e<\/td>\n<td>Oui<\/td>\n<\/tr>\n<tr>\n<td>Meilleur pour<\/td>\n<td>Rapports SLA, alertes proactives, surveillance de disponibilit\u00e9<\/td>\n<td>Analyse d\u2019exp\u00e9rience r\u00e9elle, priorisation des corrections<\/td>\n<\/tr>\n<tr>\n<td>Mode d\u2019\u00e9chec courant<\/td>\n<td>Cas limites manquants non script\u00e9s<\/td>\n<td>Apprendre les pannes via Twitter<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<p>La surveillance synth\u00e9tique ex\u00e9cute des contr\u00f4les script\u00e9s sur un horaire fixe depuis des emplacements fixes. Les donn\u00e9es sont coh\u00e9rentes dans le temps et immunes aux baisses de trafic. Elle fonctionne \u00e9galement \u00e0 3 heures du matin quand aucun utilisateur r\u00e9el n\u2019est pr\u00e9sent pour remarquer un d\u00e9ploiement qui a cass\u00e9 la page de connexion. C\u2019est pourquoi la surveillance synth\u00e9tique est l\u2019outil adapt\u00e9 pour les rapports SLA, la d\u00e9tection des r\u00e9gressions et les alertes proactives.<\/p>\n<p>La RUM (Real User Monitoring) capture les donn\u00e9es de performance et d\u2019erreur depuis les navigateurs r\u00e9els. Elle refl\u00e8te la vraie distribution des appareils, r\u00e9seaux et g\u00e9ographies de vos utilisateurs. C\u2019est la seule source qui peut vous dire qu\u2019une tranche de 2 % des utilisateurs Android sous un op\u00e9rateur sp\u00e9cifique voit un temps de premier octet de 9 secondes. La RUM est l\u2019outil ad\u00e9quat pour comprendre l\u2019exp\u00e9rience r\u00e9elle et prioriser le travail d\u2019ing\u00e9nierie.<\/p>\n<p>Utilisez la synth\u00e9tique pour savoir que le site est en ligne et fonctionne normalement. Utilisez la RUM pour savoir comment ce comportement affecte les utilisateurs qui vous paient. Les \u00e9quipes qui choisissent l\u2019un et ignorent l\u2019autre se retrouvent soit surprises par des cas limites (synth\u00e9tique uniquement), soit apprennent les pannes via Twitter (RUM uniquement).<\/p>\n<div class=\"cta-box\">\n<h3 id='voyez-les-deux-visages-de-votre-site'  id=\"boomdevs_4\">Voyez les Deux Visages de Votre Site<\/h3>\n<p>Dotcom-Monitor ex\u00e9cute une <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/solutions\/synthetic-monitoring\/\">surveillance synth\u00e9tique en vrai navigateur<\/a> depuis un r\u00e9seau mondial de points de contr\u00f4le et s\u2019int\u00e8gre avec les donn\u00e9es RUM que votre \u00e9quipe front-end collecte d\u00e9j\u00e0. Une plateforme, deux vues.<\/p>\n<p><a href=\"https:\/\/userauth.dotcom-monitor.com\/Account\/FreeTrialSignUp?SolutionType=Monitoring\">Commencez un essai gratuit \u2192<\/a><\/p>\n<\/div>\n<h2 id='surveillez-depuis-les-g\u00e9ographies-qui-g\u00e9n\u00e8rent-du-revenu'  id=\"boomdevs_5\" id=\"geo\">Surveillez depuis les g\u00e9ographies qui g\u00e9n\u00e8rent du revenu<\/h2>\n<p>Un contr\u00f4le depuis votre centre de donn\u00e9es voisin vous dit si ce centre est en ligne. Il ne vous dit pas si un utilisateur \u00e0 S\u00e3o Paulo passe une bonne journ\u00e9e.<\/p>\n<p>La r\u00e8gle est simple : placez des points de contr\u00f4le dans chaque r\u00e9gion qui contribue de fa\u00e7on significative au chiffre d\u2019affaires, plus une ou deux r\u00e9gions qui servent de contr\u00f4le. Si 35 % de vos ventes viennent d\u2019EMEA, vous avez besoin d\u2019au moins deux points de contr\u00f4le dans cette r\u00e9gion \u2013 un dans un march\u00e9 principal comme Francfort ou Londres, un autre dans un march\u00e9 secondaire comme Madrid ou Stockholm. Une couverture EMEA avec un seul point de contr\u00f4le masque les pannes des FAI r\u00e9gionaux et les d\u00e9faillances des CDN.<\/p>\n<p>Trois sch\u00e9mas \u00e0 mettre en place :<\/p>\n<ol>\n<li><strong>Confirmation multi-g\u00e9o pour les alertes.<\/strong> Exigez qu\u2019un \u00e9chec se r\u00e9p\u00e8te dans au moins deux r\u00e9gions distinctes dans les 60 secondes avant de d\u00e9clencher une alerte. Une r\u00e9gion qui \u00e9choue isol\u00e9ment est g\u00e9n\u00e9ralement un probl\u00e8me local d\u2019op\u00e9rateur ou un probl\u00e8me du point de contr\u00f4le, pas une panne du site.<\/li>\n<li><strong>Seuils r\u00e9gionaux.<\/strong> Tokyo et Iowa ne chargent pas votre site \u00e0 la m\u00eame vitesse et ils ne devraient pas partager un m\u00eame seuil. Suivez la latence au 95e centile par r\u00e9gion et alertez sur les \u00e9carts r\u00e9gionaux, pas sur la moyenne globale.<\/li>\n<li><strong>Agents priv\u00e9s dans les r\u00e9seaux d\u2019entreprise.<\/strong> Si vous vendez \u00e0 des entreprises qui acc\u00e8dent \u00e0 votre app depuis derri\u00e8re leur propre pare-feu, faites tourner un point de contr\u00f4le dans cet environnement. Les <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/caracteristiques-agents-prives\/\">agents priv\u00e9s<\/a> d\u00e9tectent les probl\u00e8mes caus\u00e9s par le r\u00e9seau du client, pas le v\u00f4tre, ce qui reste pourtant \u00e9vident pour le client.<\/li>\n<\/ol>\n<p>Le <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/caracteristiques-surveillance-du-reseau\/\">r\u00e9seau de points de contr\u00f4le Dotcom-Monitor<\/a> couvre plus de 30 pays ; la liste exacte \u00e0 activer d\u00e9pend de l\u00e0 o\u00f9 votre argent vient, pas de l\u00e0 o\u00f9 se trouve votre centre de donn\u00e9es.<\/p>\n<h2 id='d\u00e9finissez-les-seuils-\u00e0-partir-des-bases-de-r\u00e9f\u00e9rence-pas-\u00e0-partir-de-chiffres-ronds'  id=\"boomdevs_6\" id=\"thresholds\">D\u00e9finissez les seuils \u00e0 partir des bases de r\u00e9f\u00e9rence, pas \u00e0 partir de chiffres ronds<\/h2>\n<p>Le p\u00e9ch\u00e9 le plus courant en surveillance est \u00ab alerter si le temps de r\u00e9ponse &gt; 3 secondes \u00bb. Trois secondes est un chiffre rond. Votre site ne se soucie pas des chiffres ronds. Si votre p95 r\u00e9el est 4,2 secondes et stable, vous serez alert\u00e9 24 fois par jour pour un comportement normal. Si votre p95 r\u00e9el est 0,8 seconde et se d\u00e9grade \u00e0 2,5 secondes, vous n\u2019aurez aucune alerte car 2,5 est toujours inf\u00e9rieur \u00e0 3.<\/p>\n<p>La solution est un seuil relatif \u00e0 la base de r\u00e9f\u00e9rence :<\/p>\n<blockquote><p>Alertez lorsqu\u2019un p95 soutenu sur une fen\u00eatre de 10 minutes d\u00e9passe (p95 de base \u00d7 1,5) <strong>ou<\/strong> (p95 de base + 2\u03c3), selon la plus grande valeur, et que la condition persiste sur deux fen\u00eatres d\u2019\u00e9valuation cons\u00e9cutives.<\/p><\/blockquote>\n<p>Cette formule fait trois choses en m\u00eame temps. Le facteur 1,5\u00d7 s\u2019adapte \u00e0 la page pour qu\u2019une page rapide et une page lente puissent partager la m\u00eame r\u00e8gle. Le terme 2\u03c3 supprime la volatilit\u00e9 normale. La r\u00e8gle de \u00ab deux fen\u00eatres cons\u00e9cutives \u00bb \u00e9limine les faux positifs dus aux pics ponctuels.<\/p>\n<p>Le calcul de la base de r\u00e9f\u00e9rence est la partie que la plupart des \u00e9quipes sautent. Recalculez la base de r\u00e9f\u00e9rence chaque semaine \u00e0 partir des 14 jours pr\u00e9c\u00e9dents, en excluant les fen\u00eatres de d\u00e9ploiement et les p\u00e9riodes d\u2019incident connues. Les produits de d\u00e9tection d\u2019anomalie qui calculent automatiquement les bases de r\u00e9f\u00e9rence sont une bonne solution de facilit\u00e9 si vous ne voulez pas g\u00e9rer cela manuellement, mais v\u00e9rifiez ce qu\u2019ils excluent. Une base de r\u00e9f\u00e9rence contamin\u00e9e par un incident r\u00e9cent est pire qu\u2019aucune base du tout.<\/p>\n<p>Pour les contr\u00f4les de disponibilit\u00e9, la r\u00e8gle \u00e9quivalente : exigez deux \u00e9checs cons\u00e9cutifs de deux g\u00e9ographies distinctes avant de d\u00e9clencher une alerte. Un \u00e9chec unique depuis un seul endroit est presque toujours un probl\u00e8me de point de contr\u00f4le. Deux \u00e9checs de deux sources sont r\u00e9els.<\/p>\n<h2 id='concevez-l-alerte-pas-seulement-la-v\u00e9rification'  id=\"boomdevs_7\" id=\"alerts\">Concevez l\u2019alerte, pas seulement la v\u00e9rification<\/h2>\n<p>Une v\u00e9rification vous dit qu\u2019un \u00e9v\u00e9nement s\u2019est produit. Une alerte dit \u00e0 un humain de faire quelque chose. Ce sont des probl\u00e8mes diff\u00e9rents et la plupart des \u00e9quipes con\u00e7oivent uniquement le premier.<\/p>\n<p>Le travail de l\u2019ing\u00e9nierie des alertes est d\u2019envoyer la bonne information \u00e0 la bonne personne dans un format qui lui permet d\u2019agir en moins de 60 secondes. Les obstacles sont souvent :<\/p>\n<ul>\n<li><strong>Trop d\u2019alertes.<\/strong> Si l\u2019ing\u00e9nieur de garde moyen est appel\u00e9 plus de trois fois par service, la prochaine alerte sera trait\u00e9e avec moins d\u2019attention. Ce n\u2019est pas un d\u00e9faut moral. C\u2019est la nature de l\u2019attention humaine.<\/li>\n<li><strong>Alertes sans contexte.<\/strong> \u00ab Paiement lent \u00bb n\u2019est pas exploitable. \u00ab Paiement p95 4,8s (base 1,1s) depuis r\u00e9gions EU, commenc\u00e9 \u00e0 14:32 UTC, corr\u00e9l\u00e9 avec d\u00e9ploiement abc123 \u00e0 14:30 \u00bb est exploitable.<\/li>\n<li><strong>Mauvais canal.<\/strong> Slack n\u2019est pas une alerte de garde. Email non plus. SMS, push ou appel t\u00e9l\u00e9phonique sont des alertes. Les m\u00e9langer dilue le signal.<\/li>\n<\/ul>\n<p>Le sch\u00e9ma qui fonctionne :<\/p>\n<ol>\n<li><strong>Trois niveaux de gravit\u00e9, trois canaux.<\/strong> Critique (site inaccessible, paiement cass\u00e9) \u2192 SMS ou t\u00e9l\u00e9phone. Avertissement (d\u00e9gradation soutenue) \u2192 push ou chat avec mention du garde. Info (\u00e9chec unique, d\u00e9rive de base) \u2192 tableau de bord ou r\u00e9sum\u00e9 quotidien. Ne jamais alerter sur info.<\/li>\n<li><strong>Suppression des d\u00e9pendances.<\/strong> Si DNS \u00e9choue, ne d\u00e9clenchez pas aussi l\u2019alerte sur les 14 contr\u00f4les HTTP en aval qui d\u00e9pendent du DNS. <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/fonctionnalites-alertes\/\">Le regroupement d\u2019alertes et la suppression des d\u00e9pendances<\/a> sont indispensables ; si votre plateforme ne les supporte pas, vous payez en sommeil.<\/li>\n<li><strong>R\u00e9seau d\u2019escalade, pas cha\u00eene.<\/strong> Si le premier ing\u00e9nieur de garde ne r\u00e9pond pas en 5 minutes, alertez le second <em>et<\/em> notifiez le canal. L\u2019escalade en s\u00e9rie vous co\u00fbte 5 minutes par niveau alors que le site est en panne.<\/li>\n<li><strong>Heures calmes pour non critique.<\/strong> Les r\u00e9gressions la nuit vers 2h du matin le dimanche ne n\u00e9cessitent g\u00e9n\u00e9ralement pas un r\u00e9veil \u00e0 2h. Les cas critiques oui. Soyez honn\u00eate en configurant les r\u00e8gles.<\/li>\n<\/ol>\n<p>Et mesurez la pr\u00e9cision. Chaque mois, comptez les alertes d\u00e9clench\u00e9es et \u00e9tiquetez-les : incident r\u00e9el, faux positif, action non requise. Si la pr\u00e9cision est en dessous de 80 %, corrigez les alertes les plus bruyantes avant d\u2019en ajouter de nouvelles.<\/p>\n<h2 id='couvrez-les-\u00e9l\u00e9ments-que-vous-ne-contr\u00f4lez-pas'  id=\"boomdevs_8\" id=\"third-party\">Couvrez les \u00e9l\u00e9ments que vous ne contr\u00f4lez pas<\/h2>\n<p>Votre site n\u2019est pas seulement votre code. Une page de paiement moderne charge des scripts d\u2019un processeur de paiement, d\u2019un gestionnaire de balises, d\u2019un fournisseur d\u2019analytique, d\u2019un widget chat, d\u2019un outil de test A\/B, d\u2019un CDN, et parfois d\u2019un service de d\u00e9tection de fraude. Chacun peut faire tomber la page.<\/p>\n<p>Les d\u00e9pendances tierces doivent avoir leurs propres moniteurs :<\/p>\n<ul>\n<li><strong>Temps de r\u00e9ponse CDN par r\u00e9gion.<\/strong> Les CDN \u00e9chouent, surtout pendant les \u00e9v\u00e9nements r\u00e9gionaux.<\/li>\n<li><strong>Temps aller-retour du paiement<\/strong> en contr\u00f4le API synth\u00e9tique contre le point de statut du gateway ou sandbox.<\/li>\n<li><strong>Temps de chargement des balises analytics et gestionnaire de tags<\/strong> mesur\u00e9 dans la transaction synth\u00e9tique. Une balise analytique bloquante ajoute 2 secondes \u00e0 chaque page ; vous devez le savoir.<\/li>\n<li><strong>Fournisseurs d\u2019authentification externes<\/strong> (OAuth, SSO). Si votre bouton \u00ab se connecter avec Google \u00bb cesse de fonctionner, vous devez le savoir avant votre support.<\/li>\n<li><strong>Fournisseurs DNS.<\/strong> Faites de la <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/outil-de-surveillance-dns-dotcom-monitor\/\">surveillance DNS<\/a> depuis plusieurs r\u00e9solveurs pour d\u00e9tecter les retards de propagation et les pannes partielles chez le fournisseur.<\/li>\n<\/ul>\n<p>Documentez quels tiers bloquent quels parcours utilisateurs. Lorsqu\u2019un tiers \u00e9choue, le runbook doit indiquer si la bonne action est une \u00ab solution de secours \u00bb, \u00ab patienter \u00bb, ou \u00ab contacter le garde du fournisseur \u00bb. Sans cette carte, chaque incident tiers devient un exercice d\u2019improvisation.<\/p>\n<h2 id='assurez-que-chaque-moniteur-est-li\u00e9-\u00e0-un-runbook'  id=\"boomdevs_9\" id=\"runbook\">Assurez que chaque moniteur est li\u00e9 \u00e0 un runbook<\/h2>\n<p>Les cinq minutes les plus co\u00fbteuses de tout incident sont celles o\u00f9 l\u2019ing\u00e9nieur de garde cherche \u00e0 comprendre ce que l\u2019alerte signifie.<\/p>\n<p>R\u00e9glez cela une fois pour toutes : chaque moniteur doit \u00eatre associ\u00e9 \u00e0 une fiche runbook. Le runbook n\u2019a pas besoin d\u2019\u00eatre \u00e9labor\u00e9. Trois sections suffisent :<\/p>\n<ol>\n<li><strong>Ce que cette v\u00e9rification couvre<\/strong> en une phrase. (\u00ab Valide que la transaction de paiement EU se compl\u00e8te en moins de 5 secondes depuis Francfort et Amsterdam.\u00bb)<\/li>\n<li><strong>Les cinq premi\u00e8res choses \u00e0 v\u00e9rifier<\/strong> lors du d\u00e9clenchement. Liens vers page de statut, tableaux de bord, d\u00e9ploiements r\u00e9cents, alertes associ\u00e9es, page de statut du fournisseur.<\/li>\n<li><strong>Sch\u00e9mas connus de faux positifs<\/strong>, s\u2019il y en a. (\u00ab Le point de contr\u00f4le de Francfort expire parfois durant la maintenance du fournisseur, samedis 02:00-02:30 UTC. Supprim\u00e9e. \u00bb)<\/li>\n<\/ol>\n<p>La premi\u00e8re r\u00e9daction d\u2019un runbook prend 15 minutes. Chaque incident suivant sur ce moniteur en prend 15 de moins. Le calcul est \u00e9vident et pourtant la plupart des \u00e9quipes ne le font toujours pas.<\/p>\n<h2 id='validez-les-moniteurs-et-auditez-la-couverture-chaque-trimestre'  id=\"boomdevs_10\" id=\"audit\">Validez les moniteurs et auditez la couverture chaque trimestre<\/h2>\n<p>Un moniteur non test\u00e9 est un souhait, pas une garantie. Deux pratiques permettent d\u2019identifier les lacunes.<\/p>\n<p><strong>Faites un test chaos des alertes.<\/strong> Une fois par trimestre, cassez d\u00e9lib\u00e9r\u00e9ment une v\u00e9rification \u2013 arr\u00eatez un endpoint test, faites expirer un certificat dans un environnement de staging, abaissez le seuil de temps de r\u00e9ponse \u00e0 0 \u2013 et confirmez que l\u2019alerte se d\u00e9clenche, s\u2019escalade, et arrive \u00e0 la bonne personne. Environ un tiers des alertes \u00e9chouent leur premier test. Causes courantes : rotations de garde p\u00e9rim\u00e9es, tokens d\u2019int\u00e9gration expir\u00e9s, canaux Slack que personne ne lit plus.<\/p>\n<p><strong>Auditez la carte de couverture trimestriellement.<\/strong> Maintenez un document unique listant chaque parcours utilisateur, chaque d\u00e9pendance externe et chaque cat\u00e9gorie d\u2019URL. Pour chaque ligne, listez les moniteurs qui la couvrent. Les lignes vides sont des lacunes. Les nouvelles fonctionnalit\u00e9s ajout\u00e9es au cours du trimestre se trouvent g\u00e9n\u00e9ralement dans les lignes vides.<\/p>\n<p>L\u2019audit produit aussi le constat inverse : des moniteurs sur des URL qui n\u2019existent plus. Supprimez-les. Un moniteur sur un endpoint 410 g\u00e9n\u00e8re du bruit pour toujours et ne prot\u00e8ge rien.<\/p>\n<figure id=\"attachment_33984\" aria-describedby=\"caption-attachment-33984\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img decoding=\"async\" class=\"size-full wp-image-33984\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve.webp\" alt=\"Chart showing the relationship between alert volume and response quality, with annotations marking the alert fatigue threshold around three pages per shift\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33984\" class=\"wp-caption-text\">Au-del\u00e0 de trois alertes par service, la qualit\u00e9 de la r\u00e9ponse diminue plus rapidement que le volume d\u2019alertes n\u2019augmente.<\/figcaption><\/figure>\n<h2 id='ce-qu-il-faut-rechercher-dans-une-plateforme-de-surveillance'  id=\"boomdevs_11\" id=\"tooling\">Ce qu\u2019il faut rechercher dans une plateforme de surveillance<\/h2>\n<p>La plupart des plateformes peuvent pinguer une URL. Les diff\u00e9rences apparaissent dans les cas complexes. Lors de l\u2019\u00e9valuation des outils, ne vous limitez pas aux d\u00e9mos de tableau de bord et demandez-vous :<\/p>\n<ul>\n<li><strong>Peut-elle automatiser une transaction en vrai navigateur avec logique conditionnelle ?<\/strong> Les enregistrements statiques cassent lorsque la page change pour la premi\u00e8re fois. La surveillance transactionnelle scriptable (type Selenium ou propri\u00e9taire) supporte l\u2019\u00e9volution normale du produit.<\/li>\n<li><strong>Combien de protocoles natifs sont pris en charge ?<\/strong> HTTP, HTTPS, DNS, FTP, SMTP, IMAP, POP3, TCP, UDP, ICMP. Chaque protocole externalis\u00e9 \u00e0 un outil distinct est une relation fournisseur et un identifiant de connexion suppl\u00e9mentaire.<\/li>\n<li><strong>\u00c0 quoi ressemble vraiment la couverture mondiale de points de contr\u00f4le ?<\/strong> Un fournisseur avec 200 \u00ab points de contr\u00f4le \u00bb tous h\u00e9berg\u00e9s dans trois r\u00e9gions cloud n\u2019est pas mondial. Demandez la liste des villes.<\/li>\n<li><strong>Peut-elle fonctionner depuis votre r\u00e9seau interne ?<\/strong> Les agents priv\u00e9s sont n\u00e9cessaires pour surveiller les environnements de staging, les applications internes et les d\u00e9ploiements priv\u00e9s clients.<\/li>\n<li><strong>Comment g\u00e8re-t-elle les d\u00e9pendances d\u2019alertes et leur regroupement ?<\/strong> Une plateforme qui g\u00e9n\u00e8re 14 alertes pour une seule panne DNS vous rendra insomniaque.<\/li>\n<li><strong>\u00c0 quoi ressemble l\u2019export des donn\u00e9es ?<\/strong> Si vous ne pouvez pas extraire les r\u00e9sultats bruts dans votre propre syst\u00e8me analytique, vous ne pourrez pas enqu\u00eater sur les incidents complexes.<\/li>\n<li><strong>Int\u00e9grations avec vos outils de gestion d\u2019incidents.<\/strong> PagerDuty, Opsgenie, Slack, Microsoft Teams, ServiceNow, Jira. Les <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/ressources-dotcom-monitor\/partenaires-et-integrations-2\/\">int\u00e9grations natives<\/a> sont sup\u00e9rieures aux solutions par webhook.<\/li>\n<\/ul>\n<p>Pour une checklist d\u2019achat plus approfondie avec des grilles d\u2019\u00e9valuation, consultez <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/best-website-monitoring-tool\/\">comment choisir le meilleur outil de surveillance de site<\/a> et <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/datadog-competitors\/\">les concurrents et alternatives \u00e0 Datadog<\/a> pour comprendre o\u00f9 se situe chaque acteur.<\/p>\n<h2 id='modes-d-\u00e9checs-courants'  id=\"boomdevs_12\" id=\"failure-modes\">Modes d\u2019\u00e9checs courants<\/h2>\n<p>Les sch\u00e9mas ci-dessous apparaissent dans presque toutes les revues de surveillance. Aucun ne n\u00e9cessite de nouveaux outils pour \u00eatre corrig\u00e9.<\/p>\n<ul>\n<li><strong>Un seuil global pour un site multi-r\u00e9gions.<\/strong> La r\u00e9gion rapide devient plus lente, la r\u00e9gion lente se d\u00e9grade, la moyenne globale semble correcte, et l\u2019alerte ne se d\u00e9clenche jamais.<\/li>\n<li><strong>Contr\u00f4les avec statut 200 sans assertion de contenu.<\/strong> Un 200 vide venant d\u2019une page d\u2019erreur CDN passe le contr\u00f4le et entre en production.<\/li>\n<li><strong>Transactions synth\u00e9tiques d\u00e9pendant d\u2019un compte client r\u00e9el.<\/strong> Mot de passe expir\u00e9, MFA activ\u00e9, compte verrouill\u00e9. Utilisez un compte service avec un p\u00e9rim\u00e8tre de surveillance explicite.<\/li>\n<li><strong>Alertes de certificat uniquement \u00e0 7 jours.<\/strong> Sept jours est la date limite, pas l\u2019alerte. \u00c0 ce moment, quelqu\u2019un est d\u00e9j\u00e0 en train d\u2019\u00e9teindre le feu. Alertez \u00e0 60, 30, 14 et 3 jours. La <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/ssl-certificate-monitoring\/\">configuration de la surveillance des certificats SSL<\/a> doit \u00eatre pr\u00eate en avance.<\/li>\n<li><strong>Aucune corr\u00e9lation avec les d\u00e9ploiements.<\/strong> Si vos alertes ne montrent pas \u00ab cette alerte s\u2019est d\u00e9clench\u00e9e 3 minutes apr\u00e8s le d\u00e9ploiement abc123 \u00bb, chaque incident commence par une revue manuelle de git log. Connectez votre CI \u00e0 vos annotations de surveillance.<\/li>\n<li><strong>Seuils d\u2019alerte qui ne sont jamais resserr\u00e9s.<\/strong> Si vous avez mis \u00ab &gt; 5 secondes \u00bb il y a deux ans et que le site est maintenant deux fois plus rapide, ce seuil est fonctionnellement d\u00e9sactiv\u00e9.<\/li>\n<li><strong>Surveillance de la page d\u2019accueil mais pas du parcours de conversion.<\/strong> La disponibilit\u00e9 de la page d\u2019accueil est un indicateur de vanit\u00e9. La disponibilit\u00e9 du paiement, de l\u2019inscription et de la connexion est ce qui compte.<\/li>\n<\/ul>\n<p>Pour des d\u00e9tails sp\u00e9cifiques \u00e0 la couche applicative \u2013 notamment autour des API, des parcours script\u00e9s et des topologies de microservices \u2013 associez ceci avec <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/web-application-monitoring-best-practices\/\">les meilleures pratiques de surveillance des applications web<\/a>. Et pour tout ce qui concerne le SEO et l\u2019importance des budgets de latence, consultez <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/comment-la-vitesse-du-site-affecte-seo\/\">comment la vitesse du site affecte le SEO<\/a>.<\/p>\n<h2 id='mettez-ce-playbook-en-pratique'  id=\"boomdevs_13\" id=\"cta-closer\">Mettez ce playbook en pratique<\/h2>\n<p>Choisissez trois pratiques dans cette liste que votre configuration actuelle ne g\u00e8re pas. Mettez-les en \u0153uvre lors de ce sprint. Faites le test chaos sur les nouveaux moniteurs avant de les consid\u00e9rer termin\u00e9s. Puis auditez la pr\u00e9cision dans 30 jours.<\/p>\n<p>Si la plateforme est le goulot d\u2019\u00e9tranglement, Dotcom-Monitor couvre toute la cha\u00eene en un seul endroit : surveillance synth\u00e9tique en vrai navigateur, contr\u00f4les multi-protocoles, r\u00e9seau mondial de points de contr\u00f4le avec agents priv\u00e9s, et fonctionnalit\u00e9s d\u2019ing\u00e9nierie d\u2019alerte con\u00e7ues pour les sch\u00e9mas ci-dessus. Voir <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/surveillance-des-applications-web\/\">la surveillance applicative web<\/a>, <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/web-api-monitoring\/\">la surveillance API<\/a>, <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/outil-de-surveillance-dns-dotcom-monitor\/\">la surveillance DNS<\/a>, et <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/ssl-certificate-monitoring\/\">la surveillance des certificats SSL<\/a>, ou passez directement \u00e0 la <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/surveillance-des-performances-de-lentreprise\/\">vue d\u2019ensemble de la surveillance entreprise<\/a> pour les environnements plus larges.<\/p>\n<div class=\"cta-box\">\n<h3 id='essayez-la-plateforme-sur-laquelle-ce-playbook-a-\u00e9t\u00e9-\u00e9crit'  id=\"boomdevs_14\">Essayez la plateforme sur laquelle ce playbook a \u00e9t\u00e9 \u00e9crit<\/h3>\n<p>Surveillance en vrai navigateur depuis plus de 30 pays, contr\u00f4les multi-protocoles, transactions scriptables, et ing\u00e9nierie d\u2019alerte qui respecte votre sommeil.<\/p>\n<p><a href=\"https:\/\/userauth.dotcom-monitor.com\/Account\/FreeTrialSignUp?SolutionType=Monitoring\">Commencez votre essai gratuit Dotcom-Monitor \u2192<\/a> Sans carte bancaire. Ou <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/prix\/\">voir les tarifs<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Ce que c&#8217;est, pourquoi c&#8217;est important, et les meilleures pratiques pour choisir le meilleur service de surveillance de site web pour la disponibilit\u00e9, la performance et l&#8217;exp\u00e9rience utilisateur.<\/p>\n","protected":false},"author":39,"featured_media":33993,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3685],"tags":[],"class_list":["post-32295","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-surveillance-des-services-reseau"],"_links":{"self":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/32295","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/users\/39"}],"replies":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/comments?post=32295"}],"version-history":[{"count":0,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/32295\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/media\/33993"}],"wp:attachment":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/media?parent=32295"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/categories?post=32295"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/tags?post=32295"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}