{"id":32295,"date":"2026-01-05T13:19:19","date_gmt":"2026-01-05T13:19:19","guid":{"rendered":"https:\/\/www.dotcom-monitor.com\/blog\/website-monitoring-best-practices\/"},"modified":"2026-07-15T21:12:10","modified_gmt":"2026-07-15T21:12:10","slug":"website-monitoring-best-practices","status":"publish","type":"post","link":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/website-monitoring-best-practices\/","title":{"rendered":"Bonnes pratiques de surveillance de site Web r\u00e9ellement utilis\u00e9es par les ing\u00e9nieurs"},"content":{"rendered":"<figure id=\"attachment_33991\" aria-describedby=\"caption-attachment-33991\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-33991\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices.webp\" alt=\"Ing\u00e9nieur des op\u00e9rations examinant un tableau de bord mondial de surveillance de site Web avec points de contr\u00f4le r\u00e9gionaux, chronologies de latence et alertes actives\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/hero-website-monitoring-best-practices-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33991\" class=\"wp-caption-text\">Une bonne surveillance vous indique ce qui a cass\u00e9, o\u00f9 et pourquoi\u2014avant que vos clients ne le fassent.<\/figcaption><\/figure>\n<p>La plupart des \u00e9quipes disposent d&#8217;une surveillance de site web. Bien moins ont une surveillance qui d\u00e9tecte r\u00e9ellement les probl\u00e8mes avant que les clients, les ventes et le support ne le fassent. L&#8217;\u00e9cart n&#8217;est que rarement d\u00fb \u00e0 l&#8217;outil. Ce sont les pratiques qui l&#8217;entourent : ce qui est v\u00e9rifi\u00e9, d&#8217;o\u00f9, \u00e0 quelle fr\u00e9quence, ce qui d\u00e9clenche une alerte, et qui d\u00e9cide quand un contr\u00f4le est cass\u00e9 versus quand le site est cass\u00e9.<\/p>\n<p>Ce manuel rassemble huit meilleures pratiques de surveillance de site Web qui distinguent les configurations auxquelles les \u00e9quipes SRE et DevOps font confiance de celles qui se transforment silencieusement en bruit. Chacune est concr\u00e8te : seuils, intervalles, anti-mod\u00e8les, et ce qu\u2019il faut continuer \u00e0 faire une fois que cela fonctionne. Les m\u00eames pratiques s\u2019appliquent que vous fassiez une surveillance de disponibilit\u00e9 sur un site marketing ou une surveillance synth\u00e9tique compl\u00e8te des transactions sur un checkout SaaS.<\/p>\n<h2 id='\u00e0-quoi-ressemble-une-bonne-et-pourquoi-la-plupart-des-configurations-la-manquent'  id=\"boomdevs_1\">\u00c0 quoi ressemble une &#8220;bonne&#8221; (et pourquoi la plupart des configurations la manquent)<\/h2>\n<p>Une d\u00e9finition de travail : votre surveillance est bonne si votre \u00e9quipe apprend chaque probl\u00e8me affectant les clients via un moniteur avant d\u2019en apprendre par un client, et si les alertes que vous recevez sont presque toujours exploitables. C&#8217;est cela le seul crit\u00e8re.<\/p>\n<p>Trois chiffres la mesurent. Le temps moyen pour d\u00e9tecter (MTTD) vous dit si la surveillance est assez rapide. Le temps moyen pour r\u00e9soudre (MTTR) vous dit si les donn\u00e9es remont\u00e9es par le moniteur suffisent \u00e0 r\u00e9soudre le probl\u00e8me. La pr\u00e9cision des alertes \u2014 le pourcentage d\u2019alertes r\u00e9elles n\u00e9cessitant une action imm\u00e9diate \u2014 vous indique si votre \u00e9quipe fera encore confiance aux alertes dans six mois. La majorit\u00e9 des \u00e9quipes SRE mesurent le MTTD et le MTTR. La plupart ne mesurent pas la pr\u00e9cision. C\u2019est pourquoi tant de rotations en astreinte se d\u00e9gradent en simples reconnaissances silencieuses et en \u00e9tat d\u2019impuissance apprise.<\/p>\n<p>Le reste de ce manuel consiste \u00e0 am\u00e9liorer ces deux chiffres simultan\u00e9ment.<\/p>\n<h2 id='superposez-les-contr\u00f4les-sur-le-chemin-complet-de-la-requ\u00eate'  id=\"boomdevs_2\">Superposez les contr\u00f4les sur le chemin complet de la requ\u00eate<\/h2>\n<p>Un seul contr\u00f4le HTTPS est comme un d\u00e9tecteur de fum\u00e9e avec un seul capteur. Il vous indique qu&#8217;il y a un probl\u00e8me, pas o\u00f9. Quand un utilisateur tape votre URL et attend que la page s\u2019affiche, la requ\u00eate traverse au moins six couches : <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/website-monitoring-errors-dns-tcp-tls-http\/\">r\u00e9solution DNS<\/a>, poign\u00e9e de main TCP, n\u00e9gociation TLS, r\u00e9ponse HTTP, chargement des ressources, et rendu c\u00f4t\u00e9 client de la vue finale. Chaque couche \u00e9choue diff\u00e9remment et chaque \u00e9chec a sa propre cause racine.<\/p>\n<figure id=\"attachment_33977\" aria-describedby=\"caption-attachment-33977\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img decoding=\"async\" class=\"size-full wp-image-33977\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack.webp\" alt=\"Sch\u00e9ma de la pile de surveillance en couches du site Web de DNS \u00e0 la transaction, chaque couche \u00e9tant associ\u00e9e \u00e0 son mode de d\u00e9faillance et au type de contr\u00f4le recommand\u00e9\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/layered-monitoring-stack-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33977\" class=\"wp-caption-text\">Un contr\u00f4le par couche. Chaque couche a une surface de d\u00e9faillance distincte et une correction sp\u00e9cifique.<\/figcaption><\/figure>\n<p>La configuration pratique ressemble \u00e0 ceci :<\/p>\n<ul>\n<li><strong>DNS :<\/strong> V\u00e9rifier que les enregistrements A, AAAA, CNAME et MX r\u00e9solvent vers les valeurs attendues \u00e0 partir de plusieurs r\u00e9solveurs. Les probl\u00e8mes DNS sont les plus faciles \u00e0 manquer et les plus p\u00e9nibles \u00e0 diagnostiquer apr\u00e8s coup. Les <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/meilleurs-outils-de-surveillance-dns\/\">meilleurs outils de surveillance DNS<\/a> surveillent les changements non autoris\u00e9s, les d\u00e9lais de propagation, et les d\u00e9faillances sp\u00e9cifiques aux r\u00e9solveurs.<\/li>\n<li><strong>TCP et ICMP :<\/strong> Confirmer que le port est ouvert et que le chemin r\u00e9seau est sain. Un changement de firewall bloquant le port 443 ne sera pas d\u00e9tect\u00e9 par un contr\u00f4le HTTP depuis le m\u00eame segment r\u00e9seau.<\/li>\n<li><strong>TLS :<\/strong> Valider la cha\u00eene de certificats, la date d&#8217;expiration, la correspondance du nom d&#8217;h\u00f4te, et le support des chiffrements. La plupart des pannes de certificats sont \u00e9vitables \u2014 le certificat a simplement expir\u00e9 un dimanche. Recevez des alertes explicites \u00e0 60, 30, 14 et 3 jours avant expiration. Voir <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/monitor-ssl-certificate-expiration\/\">comment surveiller l&#8217;expiration des certificats SSL<\/a> pour les d\u00e9tails de configuration.<\/li>\n<li><strong>HTTP :<\/strong> Code de statut, temps de r\u00e9ponse et assertion de contenu. Un statut 200 avec un corps vide est un \u00e9chec, pas un succ\u00e8s.<\/li>\n<li><strong>Rendu et transaction :<\/strong> Pilotez un vrai navigateur \u00e0 travers le parcours utilisateur, affirmez la pr\u00e9sence d\u2019un \u00e9l\u00e9ment connu dans l\u2019\u00e9tat final et mesurez le temps d\u2019interactivit\u00e9. La <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/what-is-synthetic-monitoring\/\">surveillance synth\u00e9tique<\/a> avec de vrais navigateurs d\u00e9tecte ce que les contr\u00f4les protocolaires ne peuvent pas \u2014 JavaScript cass\u00e9, scripts de tiers qui bloquent, fichier CSS manquant rendant le bouton du panier invisible.<\/li>\n<li><strong>API :<\/strong> Traitez les <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/surveillance-api\/\">API<\/a> comme des points d\u2019acc\u00e8s de premi\u00e8re classe. Un site qui charge mais ne peut pas finaliser un paiement car l\u2019API de paiement est en timeout est toujours cass\u00e9. La <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/what-is-api-monitoring\/\">surveillance des API<\/a> m\u00e9rite un planning de contr\u00f4le propre, s\u00e9par\u00e9 des pages qui en d\u00e9pendent.<\/li>\n<\/ul>\n<p>Lorsqu\u2019un probl\u00e8me survient, la couche qui d\u00e9clenche l\u2019alerte en premier est votre point de d\u00e9part pour la cause racine. Une \u00e9quipe qui ne surveille que le HTTP re\u00e7oit une seule information : indisponible. Une \u00e9quipe surveillant les six couches obtient un arbre de fautes.<\/p>\n<h2 id='faites-fonctionner-la-surveillance-synth\u00e9tique-et-rum-c\u00f4te-\u00e0-c\u00f4te-pas-l-une-\u00e0-la-place-de-l-autre'  id=\"boomdevs_3\" id=\"synthetic-rum\">Faites fonctionner la surveillance synth\u00e9tique et RUM c\u00f4te \u00e0 c\u00f4te, pas l&#8217;une \u00e0 la place de l&#8217;autre<\/h2>\n<p>Les deux m\u00e9thodes r\u00e9pondent \u00e0 des questions diff\u00e9rentes et ne sont pas substituables. Le tableau ci-dessous r\u00e9sume la r\u00e9partition choisie par la plupart des \u00e9quipes apr\u00e8s avoir test\u00e9 les deux pendant un trimestre.<\/p>\n<div class=\"table-wrap\">\n<table>\n<thead>\n<tr>\n<th>Capacit\u00e9<\/th>\n<th>Surveillance Synth\u00e9tique<\/th>\n<th>Surveillance des Utilisateurs R\u00e9els (RUM)<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Source des donn\u00e9es<\/td>\n<td>Contr\u00f4les script\u00e9s depuis des emplacements contr\u00f4l\u00e9s<\/td>\n<td>Navigateurs des visiteurs r\u00e9els<\/td>\n<\/tr>\n<tr>\n<td>Fonctionne sans trafic<\/td>\n<td>Oui<\/td>\n<td>Non<\/td>\n<\/tr>\n<tr>\n<td>Base coh\u00e9rente<\/td>\n<td>Oui \u2014 m\u00eame script, m\u00eames emplacements<\/td>\n<td>Non \u2014 varie avec la composition du trafic<\/td>\n<\/tr>\n<tr>\n<td>D\u00e9tecte les r\u00e9gressions avant les utilisateurs<\/td>\n<td>Oui<\/td>\n<td>Non<\/td>\n<\/tr>\n<tr>\n<td>Refl\u00e8te la diversit\u00e9 r\u00e9elle des appareils et r\u00e9seaux<\/td>\n<td>Limit\u00e9e<\/td>\n<td>Oui<\/td>\n<\/tr>\n<tr>\n<td>Id\u00e9al pour<\/td>\n<td>Rapports SLA, alertes proactives, surveillance de disponibilit\u00e9<\/td>\n<td>Analyse de l\u2019exp\u00e9rience r\u00e9elle, priorisation des corrections<\/td>\n<\/tr>\n<tr>\n<td>Mode d\u2019\u00e9chec courant<\/td>\n<td>Cas limites manquants non script\u00e9s<\/td>\n<td>Apprendre les pannes via Twitter<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<p>La surveillance synth\u00e9tique ex\u00e9cute des contr\u00f4les script\u00e9s selon un planning fixe depuis des emplacements fixes. Les donn\u00e9es sont coh\u00e9rentes dans le temps et insensibles aux baisses de trafic. Elle fonctionne aussi \u00e0 3 h du matin quand il n\u2019y a aucun utilisateur r\u00e9el pour remarquer le d\u00e9ploiement qui a cass\u00e9 la page de connexion. Voil\u00e0 pourquoi la surveillance synth\u00e9tique est l\u2019outil id\u00e9al pour les rapports SLA, la d\u00e9tection des r\u00e9gressions et les alertes proactives.<\/p>\n<p>RUM capture les donn\u00e9es de performances et d\u2019erreurs depuis les navigateurs r\u00e9els. Elle refl\u00e8te la distribution r\u00e9elle des appareils, r\u00e9seaux et zones g\u00e9ographiques de vos utilisateurs. C\u2019est la seule source qui peut vous dire qu\u2019une tranche de 2 % des utilisateurs Android sur un op\u00e9rateur sp\u00e9cifique voit un temps au premier octet de 9 secondes. RUM est l\u2019outil adapt\u00e9 pour comprendre l\u2019exp\u00e9rience r\u00e9elle et prioriser le travail d\u2019ing\u00e9nierie.<\/p>\n<p>Utilisez la synth\u00e9tique pour savoir que le site est op\u00e9rationnel et se comporte normalement. Utilisez RUM pour savoir comment ce comportement correspond aux personnes qui vous payent. Les \u00e9quipes qui choisissent l\u2019une au d\u00e9triment de l\u2019autre se retrouvent soit surprises par des cas limites (synth\u00e9tique seul) soit apprennent les pannes via Twitter (RUM seul).<\/p>\n<div class=\"cta-box\">\n<h3 id='voyez-les-deux-faces-de-votre-site'  id=\"boomdevs_4\">Voyez les deux faces de votre site<\/h3>\n<p>Dotcom-Monitor r\u00e9alise <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/solutions\/synthetic-monitoring\/\">la surveillance synth\u00e9tique avec v\u00e9ritables navigateurs<\/a> depuis un r\u00e9seau global de points de contr\u00f4le et s\u2019int\u00e8gre aux donn\u00e9es RUM d\u00e9j\u00e0 collect\u00e9es par votre \u00e9quipe front-end. Une plateforme, deux visions.<\/p>\n<p><a href=\"https:\/\/userauth.dotcom-monitor.com\/Account\/FreeTrialSignUp?SolutionType=Monitoring\">Commencez un essai gratuit \u2192<\/a><\/p>\n<\/div>\n<h2 id='surveillez-depuis-les-zones-g\u00e9ographiques-g\u00e9n\u00e9rant-des-revenus'  id=\"boomdevs_5\" id=\"geo\">Surveillez depuis les zones g\u00e9ographiques g\u00e9n\u00e9rant des revenus<\/h2>\n<p>Un contr\u00f4le depuis votre centre de donn\u00e9es voisin vous indique si ce centre est en ligne. Il ne vous dit pas si un utilisateur \u00e0 S\u00e3o Paulo passe une bonne journ\u00e9e.<\/p>\n<p>La r\u00e8gle est simple : placez des points de contr\u00f4le dans chaque r\u00e9gion contribuant significativement aux revenus, plus une ou deux r\u00e9gions de contr\u00f4le. Si 35 % de vos ventes viennent d\u2019EMEA, il vous faut au moins deux points de contr\u00f4le EMEA \u2014 un dans un march\u00e9 principal comme Francfort ou Londres, un dans un secondaire comme Madrid ou Stockholm. Une couverture EMEA avec un seul point masque les pannes r\u00e9gionales d\u2019ISP ou les d\u00e9faillances aux extr\u00e9mit\u00e9s des CDN.<\/p>\n<p>Trois configurations valant la peine d\u2019\u00eatre mises en place :<\/p>\n<ol>\n<li><strong>Confirmation multi-g\u00e9o pour l\u2019alerte.<\/strong> Exigez que le probl\u00e8me soit d\u00e9tect\u00e9 dans au moins deux r\u00e9gions distinctes en moins de 60 secondes avant d\u2019alerter. Une r\u00e9gion d\u00e9faillante isol\u00e9ment est g\u00e9n\u00e9ralement un probl\u00e8me d\u2019op\u00e9rateur r\u00e9gional ou un probl\u00e8me sur un point de contr\u00f4le unique, pas une panne du site.<\/li>\n<li><strong>Seuils r\u00e9gionaux.<\/strong> Tokyo et Iowa ne chargent pas votre site \u00e0 la m\u00eame vitesse et ne devraient pas partager le m\u00eame seuil. Suivez la latence p95 par r\u00e9gion et alertez sur d\u00e9viation r\u00e9gionale, pas moyenne globale.<\/li>\n<li><strong>Agents priv\u00e9s dans les r\u00e9seaux d\u2019entreprise.<\/strong> Si vous vendez \u00e0 des entreprises acc\u00e9dant \u00e0 votre app derri\u00e8re leur propre firewall, d\u00e9ployez un point de contr\u00f4le dans cet environnement. Les <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/caracteristiques-agents-prives\/\">agents priv\u00e9s<\/a> d\u00e9tectent les probl\u00e8mes caus\u00e9s par le r\u00e9seau client, pas le v\u00f4tre, mais qui restent \u00e0 leurs yeux vos probl\u00e8mes.<\/li>\n<\/ol>\n<p>Le <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/caracteristiques-surveillance-du-reseau\/\">r\u00e9seau de points de contr\u00f4le Dotcom-Monitor<\/a> couvre plus de 30 pays ; la liste \u00e0 activer d\u00e9pend de la provenance de vos revenus, pas de l\u2019emplacement de votre centre de donn\u00e9es.<\/p>\n<h2 id='fixez-des-seuils-\u00e0-partir-des-bases-pas-\u00e0-partir-de-nombres-ronds'  id=\"boomdevs_6\" id=\"thresholds\">Fixez des seuils \u00e0 partir des bases, pas \u00e0 partir de nombres ronds<\/h2>\n<p>Le p\u00e9ch\u00e9 le plus courant en surveillance est \u00ab alerter si le temps de r\u00e9ponse &gt; 3 secondes \u00bb. Trois secondes est un nombre rond. Votre site s\u2019en fiche des nombres ronds. Si votre vrai p95 est 4,2 secondes et stable, vous serez alert\u00e9 24 fois par jour pour un comportement normal. Si votre vrai p95 est 0,8 seconde et d\u00e9grade \u00e0 2,5 secondes, vous n\u2019aurez rien parce que 2,5 reste sous 3.<\/p>\n<p>La solution est un seuil relatif \u00e0 la base :<\/p>\n<blockquote><p>Alertez si un p95 soutenu sur une fen\u00eatre de 10 minutes d\u00e9passe (p95 de base \u00d7 1,5) <strong>ou<\/strong> (p95 de base + 2\u03c3), selon la valeur la plus \u00e9lev\u00e9e, et que la condition persiste sur deux fen\u00eatres d\u2019\u00e9valuation cons\u00e9cutives.<\/p><\/blockquote>\n<p>Cette formule fait trois choses \u00e0 la fois. Le multiplicateur 1,5\u00d7 s\u2019adapte \u00e0 la page pour qu\u2019une page rapide et une page lente puissent partager la m\u00eame r\u00e8gle. Le terme 2\u03c3 supprime la volatilit\u00e9 normale. La condition \u00ab deux fen\u00eatres cons\u00e9cutives \u00bb \u00e9limine les faux positifs dus \u00e0 des pics puis r\u00e9cup\u00e9rations rapides, cause majeure des nuisances d\u2019alerte.<\/p>\n<p>Le calcul des bases est la partie que la plupart des \u00e9quipes sautent. Recalculez-les chaque semaine \u00e0 partir des 14 jours pr\u00e9c\u00e9dents, en excluant les fen\u00eatres de d\u00e9ploiement et les p\u00e9riodes d\u2019incidents connus. Les produits de d\u00e9tection d\u2019anomalies qui basent automatiquement sont un raccourci valide si vous ne voulez pas g\u00e9rer \u00e7a manuellement, mais v\u00e9rifiez ce qu\u2019ils excluent. Une base contamin\u00e9e par l\u2019incident de la semaine derni\u00e8re vaut moins que pas de base du tout.<\/p>\n<p>Pour les contr\u00f4les de disponibilit\u00e9, r\u00e8gle \u00e9quivalente : exigez deux \u00e9checs cons\u00e9cutifs venant de deux g\u00e9ographies distinctes avant d\u2019alerter. Un \u00e9chec unique depuis un endroit est presque toujours un hoquet du point de contr\u00f4le. Deux \u00e9checs de deux endroits, c\u2019est r\u00e9el.<\/p>\n<h2 id='concevez-l-alerte-pas-seulement-le-contr\u00f4le'  id=\"boomdevs_7\" id=\"alerts\">Concevez l\u2019alerte, pas seulement le contr\u00f4le<\/h2>\n<p>Un contr\u00f4le vous dit que quelque chose est arriv\u00e9. Une alerte demande \u00e0 un humain d\u2019agir. Ce sont deux probl\u00e8mes diff\u00e9rents et la plupart des \u00e9quipes ne con\u00e7oivent que le premier.<\/p>\n<p>Le travail d\u2019ing\u00e9nierie des alertes est d\u2019amener la bonne information \u00e0 la bonne personne dans un format qui lui permet d\u2019agir en moins de 60 secondes. Les obstacles sont g\u00e9n\u00e9ralement :<\/p>\n<ul>\n<li><strong>Trop d\u2019alertes.<\/strong> Si l\u2019ing\u00e9nieur d\u2019astreinte moyen est alert\u00e9 plus de trois fois par poste, la prochaine alerte sera tri\u00e9e avec moins d\u2019attention. Ce n\u2019est pas un \u00e9chec moral. C\u2019est ainsi que fonctionne l\u2019attention humaine.<\/li>\n<li><strong>Alertes sans contexte.<\/strong> \u00ab Paiement lent \u00bb n\u2019est pas exploitable. \u00ab Paiement p95 4,8 s (base 1,1 s) depuis r\u00e9gions EU, commenc\u00e9 \u00e0 14:32 UTC, corr\u00e9l\u00e9 au d\u00e9ploiement abc123 \u00e0 14:30 \u00bb est exploitable.<\/li>\n<li><strong>Mauvais canal.<\/strong> Slack n\u2019alerte pas. Email n\u2019alerte pas. SMS, push ou appel t\u00e9l\u00e9phonique alertent. Les m\u00e9langer dilue le signal.<\/li>\n<\/ul>\n<p>Le mod\u00e8le qui fonctionne :<\/p>\n<ol>\n<li><strong>Trois niveaux de gravit\u00e9, trois canaux.<\/strong> Critique (site down, paiement cass\u00e9) \u2192 SMS ou t\u00e9l\u00e9phone. Avertissement (d\u00e9gradation soutenue) \u2192 push ou chat avec mention \u00e0 l\u2019astreinte. Info (\u00e9chec unique, d\u00e9rive de base) \u2192 tableau de bord ou r\u00e9sum\u00e9 quotidien. Ne jamais alerter sur info.<\/li>\n<li><strong>Suppression des d\u00e9pendances.<\/strong> Si DNS \u00e9choue, n\u2019alertez pas aussi sur les 14 contr\u00f4les HTTP en aval qui en d\u00e9pendent. Le <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/fonctionnalites\/fonctionnalites-alertes\/\">groupe d\u2019alertes et suppression des d\u00e9pendances<\/a> sont incontournables ; si votre plateforme ne les supporte pas, pr\u00e9parez-vous \u00e0 perdre du sommeil.<\/li>\n<li><strong>Grille d\u2019escalade, pas cha\u00eene d\u2019escalade.<\/strong> Si l\u2019astreinte primaire ne r\u00e9pond pas sous 5 minutes, alertez le secondaire <em>et<\/em> notifiez le canal. L\u2019escalade en s\u00e9rie vous co\u00fbte 5 minutes par \u00e9tape durant une panne.<\/li>\n<li><strong>Heures silencieuses pour les alertes non critiques.<\/strong> Les r\u00e9gressions de performance \u00e0 2\u202fh du matin un dimanche ne m\u00e9ritent g\u00e9n\u00e9ralement pas un r\u00e9veil \u00e0 2\u202fh. Les alertes critiques, oui. Soyez honn\u00eate sur ce qui est critique lors de la configuration.<\/li>\n<\/ol>\n<p>Et mesurez la pr\u00e9cision. Chaque mois, comptez les alertes d\u00e9clench\u00e9es et notez-les : incident r\u00e9el, faux positif, action non requise. Si la pr\u00e9cision est sous 80 %, r\u00e9parez les alertes les plus bruyantes avant d\u2019en ajouter de nouvelles.<\/p>\n<h2 id='couvrez-les-\u00e9l\u00e9ments-que-vous-ne-contr\u00f4lez-pas'  id=\"boomdevs_8\" id=\"third-party\">Couvrez les \u00e9l\u00e9ments que vous ne contr\u00f4lez pas<\/h2>\n<p>Votre site n\u2019est pas que votre code. Une page checkout moderne charge des scripts d\u2019un processeur de paiement, d\u2019un gestionnaire de tags, d\u2019un fournisseur d\u2019analytics, d\u2019un widget de chat, d\u2019un outil de test A\/B, d\u2019un CDN, et parfois d\u2019un service de d\u00e9tection de fraude. Chacun peut faire tomber la page.<\/p>\n<p>Les d\u00e9pendances tierces m\u00e9ritent leurs propres moniteurs :<\/p>\n<ul>\n<li><strong>Temps de r\u00e9ponse CDN par r\u00e9gion.<\/strong> Les CDN tombent en panne, surtout lors d\u2019\u00e9v\u00e9nements r\u00e9gionaux.<\/li>\n<li><strong>Temps aller-retour passerelle de paiement<\/strong> en surveillance synth\u00e9tique API contre le point de statut ou sandbox de la passerelle.<\/li>\n<li><strong>Temps de chargement des scripts de gestionnaire de tags et analytics<\/strong> mesur\u00e9 dans la transaction synth\u00e9tique. Une balise analytics bloquante ajoute 2 secondes \u00e0 chaque page ; vous voulez le savoir.<\/li>\n<li><strong>Fournisseurs d\u2019authentification externes<\/strong> (OAuth, SSO). Si votre bouton \u00ab se connecter avec Google \u00bb cesse de fonctionner, vous devez le savoir avant la file de support.<\/li>\n<li><strong>Fournisseurs DNS.<\/strong> Faites de la <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/outil-de-surveillance-dns-dotcom-monitor\/\">surveillance DNS<\/a> depuis plusieurs r\u00e9solveurs pour d\u00e9tecter retard de propagation et pannes partielles fournisseurs.<\/li>\n<\/ul>\n<p>Documentez quels tiers bloquent quels parcours utilisateurs. Lorsqu\u2019un tiers \u00e9choue, le runbook doit indiquer si l\u2019action correcte est \u00ab revenir en mode d\u00e9grad\u00e9 \u00bb, \u00ab attendre la r\u00e9solution \u00bb, ou \u00ab contacter l\u2019astreinte du fournisseur \u00bb. Sans cette carte, chaque incident tiers devient un exercice d\u2019improvisation.<\/p>\n<h2 id='reliez-chaque-moniteur-\u00e0-un-runbook'  id=\"boomdevs_9\" id=\"runbook\">Reliez chaque moniteur \u00e0 un runbook<\/h2>\n<p>Les cinq minutes les plus co\u00fbteuses de tout incident sont celles o\u00f9 l\u2019ing\u00e9nieur d\u2019astreinte cherche \u00e0 comprendre ce que l\u2019alerte signifie.<\/p>\n<p>R\u00e9glez \u00e7a une fois pour toutes : chaque moniteur doit pointer vers une entr\u00e9e de runbook. Le runbook n\u2019a pas besoin d\u2019\u00eatre \u00e9labor\u00e9. Trois sections suffisent :<\/p>\n<ol>\n<li><strong>Ce que couvre ce contr\u00f4le<\/strong> en une phrase. (\u00ab Valide que la transaction checkout EU compl\u00e8te en moins de 5 secondes depuis Francfort et Amsterdam. \u00bb)<\/li>\n<li><strong>Les cinq premi\u00e8res v\u00e9rifications<\/strong> quand elle se d\u00e9clenche. Liens vers pages statut, dashboards, d\u00e9ploiements r\u00e9cents, alertes associ\u00e9es, page de statut du fournisseur.<\/li>\n<li><strong>Sch\u00e9mas de faux positifs connus<\/strong>, si pertinents. (\u00ab Le point de contr\u00f4le Francfort expire parfois pendant la maintenance du fournisseur 02:00-02:30 UTC samedi. Supprim\u00e9. \u00bb)<\/li>\n<\/ol>\n<p>Le premier runbook prend 15 minutes \u00e0 \u00e9crire. Chaque incident suivant sur ce moniteur en prend 15 de moins. Le calcul est \u00e9vident et la plupart des \u00e9quipes ne le font toujours pas.<\/p>\n<h2 id='validez-les-moniteurs-et-auditez-la-couverture-trimestriellement'  id=\"boomdevs_10\" id=\"audit\">Validez les moniteurs et auditez la couverture trimestriellement<\/h2>\n<p>Un moniteur non test\u00e9 est un souhait, pas une garantie. Deux pratiques comblent les lacunes.<\/p>\n<p><strong>Faites un exercice de chaos sur les alertes.<\/strong> Une fois par trimestre, cassez volontairement un contr\u00f4le \u2014 arr\u00eatez un endpoint de test, faites expirer un certificat en environnement de pr\u00e9production, abaissez le seuil de temps de r\u00e9ponse \u00e0 0 \u2014 et v\u00e9rifiez que l\u2019alerte se d\u00e9clenche, s\u2019escalade et atteint la bonne personne. Environ un tiers des alertes \u00e9chouent \u00e0 leur premier exercice. Causes fr\u00e9quentes : rotations d\u2019astreinte obsol\u00e8tes, tokens d\u2019int\u00e9gration expir\u00e9s, canaux Slack plus lus.<\/p>\n<p><strong>Auditez la carte de couverture trimestriellement.<\/strong> Maintenez un document unique listant chaque parcours utilisateur, chaque d\u00e9pendance externe, et chaque cat\u00e9gorie d\u2019URLs. Pour chaque ligne, listez les moniteurs qui la couvrent. Les lignes vides sont des gaps. Les nouvelles fonctionnalit\u00e9s ajout\u00e9es le dernier trimestre se trouvent souvent dans ces gaps.<\/p>\n<p>L\u2019audit produit aussi l\u2019effet inverse : des moniteurs couvrant des URLs n\u2019existant plus. Supprimez-les. Un moniteur sur un endpoint 410 g\u00e9n\u00e8re du bruit sans fin et ne prot\u00e8ge rien.<\/p>\n<figure id=\"attachment_33984\" aria-describedby=\"caption-attachment-33984\" style=\"width: 1536px\" class=\"wp-caption alignnone\"><img decoding=\"async\" class=\"size-full wp-image-33984\" src=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve.webp\" alt=\"Graphique montrant la relation entre volume d\u2019alertes et qualit\u00e9 de r\u00e9ponse, avec annotation indiquant le seuil de fatigue d\u2019alerte vers trois pages par poste\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve.webp 1536w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-300x200.webp 300w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-1024x683.webp 1024w, https:\/\/www.dotcom-monitor.com\/blog\/wp-content\/uploads\/sites\/3\/2026\/01\/alert-precision-curve-768x512.webp 768w\" sizes=\"(max-width: 1536px) 100vw, 1536px\" \/><figcaption id=\"caption-attachment-33984\" class=\"wp-caption-text\">Au-del\u00e0 de trois alertes par poste, la qualit\u00e9 de la r\u00e9ponse chute plus vite que le volume d\u2019alertes n\u2019augmente.<\/figcaption><\/figure>\n<h2 id='ce-qu-il-faut-rechercher-dans-une-plateforme-de-surveillance'  id=\"boomdevs_11\" id=\"tooling\">Ce qu\u2019il faut rechercher dans une plateforme de surveillance<\/h2>\n<p>La plupart des plateformes peuvent pinger une URL. Les diff\u00e9rences apparaissent dans les cas plus complexes. Lors de l\u2019\u00e9valuation des outils, allez au-del\u00e0 des d\u00e9mos dashboard et demandez-vous :<\/p>\n<ul>\n<li><strong>Peut-elle piloter une transaction r\u00e9el-navigateur avec logique conditionnelle ?<\/strong> Les enregistrements statiques cassent d\u00e8s que la page change. La surveillance transactionnelle scriptable (style Selenium ou propri\u00e9taire) survit \u00e0 l\u2019\u00e9volution normale du produit.<\/li>\n<li><strong>Combien de protocoles natifs supporte-t-elle ?<\/strong> HTTP, HTTPS, DNS, FTP, SMTP, IMAP, POP3, TCP, UDP, ICMP. En externaliser certains vers un autre outil multiplie les fournisseurs et les authentifications.<\/li>\n<li><strong>Quelle est la v\u00e9ritable couverture du r\u00e9seau de points de contr\u00f4le ?<\/strong> Un vendeur avec 200 \u00ab points de contr\u00f4le \u00bb tous h\u00e9berg\u00e9s sur trois r\u00e9gions cloud ne compte pas comme global. Demandez la liste des villes.<\/li>\n<li><strong>Peut-elle s\u2019ex\u00e9cuter depuis votre r\u00e9seau interne ?<\/strong> Des agents priv\u00e9s sont indispensables pour la surveillance d\u2019environnements de test, d\u2019apps internes et de d\u00e9ploiements clients privatifs.<\/li>\n<li><strong>Comment g\u00e8re-t-elle les d\u00e9pendances et regroupements d\u2019alertes ?<\/strong> Une plateforme qui alerte 14 fois pour un seul \u00e9chec DNS vous empoisonne la vie.<\/li>\n<li><strong>\u00c0 quoi ressemble l\u2019export des donn\u00e9es ?<\/strong> Si vous ne pouvez pas extraire les r\u00e9sultats bruts des contr\u00f4les dans votre propre stack analytique, vous ne pourrez pas enqu\u00eater sur les incidents complexes.<\/li>\n<li><strong>Int\u00e9grations avec vos outils d\u2019incidents.<\/strong> PagerDuty, Opsgenie, Slack, Microsoft Teams, ServiceNow, Jira. Les <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/ressources-dotcom-monitor\/partenaires-et-integrations-2\/\">int\u00e9grations natives<\/a> surpassent toujours les connecteurs webhook.<\/li>\n<\/ul>\n<p>Pour une checklist plus compl\u00e8te avec grilles de notation, consultez <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/best-website-monitoring-tool\/\">comment choisir le meilleur outil de surveillance de site web<\/a> et <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/datadog-competitors\/\">concurrents et alternatives \u00e0 Datadog<\/a> pour le contexte de chaque acteur.<\/p>\n<h2 id='modes-de-d\u00e9faillance-communs'  id=\"boomdevs_12\" id=\"failure-modes\">Modes de d\u00e9faillance communs<\/h2>\n<p>Les sch\u00e9mas ci-dessous apparaissent dans presque toutes les revues de surveillance. Aucun ne n\u00e9cessite de nouveaux outils pour \u00eatre corrig\u00e9.<\/p>\n<ul>\n<li><strong>Un seul seuil global pour un site multi-r\u00e9gions.<\/strong> La r\u00e9gion rapide d\u00e9rive \u00e0 la hausse, la r\u00e9gion lente se d\u00e9grade, la moyenne globale para\u00eet correcte, et l\u2019alerte ne se d\u00e9clenche jamais.<\/li>\n<li><strong>Contr\u00f4les statut 200 sans assertion de contenu.<\/strong> Un 200 vide d\u2019une page d\u2019erreur CDN passe la v\u00e9rification et casse en production.<\/li>\n<li><strong>Transactions synth\u00e9tiques d\u00e9pendant d\u2019un vrai compte client.<\/strong> Mot de passe expir\u00e9, MFA activ\u00e9, compte bloqu\u00e9. Utilisez un compte de service avec un scope explicite de surveillance.<\/li>\n<li><strong>Alertes de certificat \u00e0 7 jours seulement.<\/strong> 7 jours est le d\u00e9lai butoir, pas l\u2019avertissement. \u00c0 ce moment, quelqu\u2019un est d\u00e9j\u00e0 en mode pompier. Alertez \u00e0 60, 30, 14 et 3 jours. La <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/ssl-certificate-monitoring\/\">surveillance des certificats SSL<\/a> doit \u00eatre en place.<\/li>\n<li><strong>Pas de corr\u00e9lation avec les d\u00e9ploiements.<\/strong> Si vos alertes ne disent pas \u00ab ceci s\u2019est d\u00e9clench\u00e9 3 minutes apr\u00e8s le d\u00e9ploiement abc123 \u00bb, chaque incident commence par une revue manuelle du journal git. Reliez votre CI \u00e0 vos annotations de surveillance.<\/li>\n<li><strong>Seuils d\u2019alerte jamais resserr\u00e9s.<\/strong> Si vous avez mis \u00ab &gt; 5 secondes \u00bb il y a deux ans et que le site est maintenant deux fois plus rapide, ce seuil est en r\u00e9alit\u00e9 d\u00e9sactiv\u00e9.<\/li>\n<li><strong>Surveillance de la page d\u2019accueil mais pas du parcours mon\u00e9taire.<\/strong> La disponibilit\u00e9 de la page d\u2019accueil est un indicateur de vanit\u00e9. Disponibilit\u00e9 du checkout, de l\u2019inscription et de la connexion sont le c\u0153ur du business.<\/li>\n<\/ul>\n<p>Pour des sp\u00e9cificit\u00e9s de couche applicative \u2014 particuli\u00e8rement sur les API, parcours script\u00e9s et topologies microservices \u2014 combinez cela avec <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/web-application-monitoring-best-practices\/\">les meilleures pratiques de surveillance des applications web<\/a>. Et pour l\u2019aspect SEO sur pourquoi les budgets de latence comptent, voir <a href=\"https:\/\/www.dotcom-monitor.com\/blog\/fr\/comment-la-vitesse-du-site-affecte-seo\/\">comment la vitesse du site affecte le SEO<\/a>.<\/p>\n<h2 id='mettez-ce-manuel-en-action'  id=\"boomdevs_13\" id=\"cta-closer\">Mettez ce manuel en action<\/h2>\n<p>Choisissez trois pratiques dans cette liste que votre configuration actuelle ne g\u00e8re pas. Impl\u00e9mentez-les ce sprint. Faites l\u2019exercice de chaos sur les nouveaux moniteurs avant de consid\u00e9rer la t\u00e2che termin\u00e9e. Puis auditez la pr\u00e9cision dans 30 jours.<\/p>\n<p>Si la plateforme est le goulot d\u2019\u00e9tranglement, Dotcom-Monitor couvre toute la pile dans un seul endroit : surveillance synth\u00e9tique avec v\u00e9ritables navigateurs, contr\u00f4les multi-protocole, r\u00e9seau global de points de contr\u00f4le avec agents priv\u00e9s, et fonctionnalit\u00e9s d\u2019ing\u00e9nierie d\u2019alerte con\u00e7ues pour les sch\u00e9mas ci-dessus. Voir <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/surveillance-des-applications-web\/\">surveillance des applications web<\/a>, <a href=\"https:\/\/www.dotcom-monitor.com\/products\/web-api-monitoring\/\">surveillance API<\/a>, <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/outil-de-surveillance-dns-dotcom-monitor\/\">surveillance DNS<\/a>, et <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/produits-de-surveillance\/ssl-certificate-monitoring\/\">surveillance des certificats SSL<\/a>, ou passez directement \u00e0 l\u2019aper\u00e7u <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/surveillance-des-performances-de-lentreprise\/\">de la surveillance d\u2019entreprise<\/a> pour les environnements plus importants.<\/p>\n<div class=\"cta-box\">\n<h3 id='essayez-la-plateforme-sur-laquelle-ce-manuel-a-\u00e9t\u00e9-\u00e9crit'  id=\"boomdevs_14\">Essayez la plateforme sur laquelle ce manuel a \u00e9t\u00e9 \u00e9crit<\/h3>\n<p>Surveillance avec de vrais navigateurs depuis plus de 30 pays, contr\u00f4les multi-protocole, transactions scriptables, et ing\u00e9nierie d\u2019alertes qui respectent votre sommeil.<\/p>\n<p><a href=\"https:\/\/userauth.dotcom-monitor.com\/Account\/FreeTrialSignUp?SolutionType=Monitoring\">Commencez votre essai gratuit Dotcom-Monitor \u2192<\/a> Sans carte de cr\u00e9dit. Ou <a href=\"https:\/\/www.dotcom-monitor.com\/fr\/prix\/\">voir les tarifs<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Ce que c&#8217;est, pourquoi c&#8217;est important, et les meilleures pratiques pour choisir le meilleur service de surveillance de site web pour la disponibilit\u00e9, la performance et l&#8217;exp\u00e9rience utilisateur.<\/p>\n","protected":false},"author":39,"featured_media":33993,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3446],"tags":[],"class_list":["post-32295","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-non-classifiee"],"_links":{"self":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/32295","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/users\/39"}],"replies":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/comments?post=32295"}],"version-history":[{"count":0,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/32295\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/media\/33993"}],"wp:attachment":[{"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/media?parent=32295"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/categories?post=32295"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.dotcom-monitor.com\/blog\/fr\/wp-json\/wp\/v2\/tags?post=32295"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}