
合成监控是一种主动性能测试方法,使用脚本化的自动化事务模拟真实用户与您的应用程序的交互——在问题影响实际用户之前,测量可用性、响应时间和功能。
如果您的应用在凌晨3点宕机,或在尚无真实用户的区域变得极其缓慢,您需要在下一次探测间隔内迅速得知这一情况,而不是等到客户投诉到达您的邮箱。这正是合成监控的设计初衷。
在本指南中,我们将涵盖您需要了解的所有关于合成监控的内容:它是如何工作的,不同类型的测试,哪些指标重要,它与真实用户监控(RUM)和APM的比较,以及如何在生产环境中有效使用它。我们还将揭示鲜有人提及的局限性,并分享SRE和DevOps团队大规模使用的最佳实践。
什么是合成监控?
合成监控——也称为主动监控、定向监控或合成测试——通过部署自动化监控代理,按设定的时间表持续向您的应用、API或网络服务发送脚本化请求来工作。这些代理在不同的技术层面操作:轻量级的HTTP代理发送请求以检查基本的可用性和响应码,以及运行完整浏览器引擎的复杂基于浏览器的代理来执行JavaScript、渲染页面、管理会话并模拟复杂的多步骤用户交互。Dotcom-Monitor的EveryStep Web Recorder使用真实浏览器——不仅仅是无头引擎——记录并回放跨40多种桌面和移动浏览器配置的任何用户操作。
由于这些是脚本化的模拟,而非对真实流量的被动观察,合成监控全天候运行,无论是否有真实用户活跃。您可以获得来自受控环境的一致且可复现的性能数据——无论是白天还是夜晚,高峰流量时段还是安静的维护窗口。
“主动监控”这一术语将其与被动方式如真实用户监控(RUM)区分开来,后者仅在实际用户与系统交互时捕获数据。合成监控无需等待——它按计划进行探测,以便您能够快速发现故障和性能回退,通常是在下一次探测间隔内,而不是等待用户报告。
合成监控是如何工作的?

合成监控的核心遵循一个简单的循环:模拟、测量、警报、重复。以下是一步步的工作流程:
- 定义关键的用户流程和端点。确定哪些事务最重要:登录流程、结账过程、API 健康检查、DNS 解析和 SSL 证书有效性。
- 录制或编写测试脚本。使用像 Dotcom-Monitor 的 EveryStep Web Recorder 这样的工具捕捉真实浏览器交互——点击、表单输入、导航——并将其保存为可回放的脚本。对于 API 和协议检查,直接在平台上配置 HTTP、DNS 或 ping 任务。
- 在全球范围内部署监控代理。使用公共代理在多个地理位置运行测试 (30 多个全球位置) 和/或在您自己的数据中心或网络边界内部署私有代理。
- 按计划执行。测试按配置的时间间隔运行——频率可高达 每分钟至每三小时一次。监控代理发送脚本请求,等待响应,并记录结果。
- 测量技术和功能指标。捕获响应时间、HTTP 状态码、页面加载时间、首字节时间(TTFB)、首次内容绘制(FCP)和核心网页指标(LCP、CLS 和 INP)。请注意,像 INP 这样的交互指标反映真实用户输入,最好与真实用户数据一起验证——合成监控提供的是受控的实验室式测量。
- 对确认的问题发出警报。默认情况下,Dotcom-Monitor 会在检测到问题时立即发送警报。可配置的过滤器——如基于阈值的触发器、错误类型条件或特定位置规则——帮助您减少对不太重要检查的噪声。对于多步骤事务测试,启用自动重试前请考虑是否重试失败脚本可能产生意外副作用。
- 战略性使用观察点。私有代理通过测试可确认特定服务和流程在该内部观察点正常运行——帮助您判断问题是面向互联网、边缘相关还是内部问题。外部全球代理测量完整的用户路径:DNS 解析、CDN 边缘、ISP 路径和地理延迟。
观看 Dotcom-Monitor 的合成监控实际演示 → 浏览合成监控解决方案页面
7 种合成监控测试类型
成熟的监控策略结合多种测试类型 — 每种验证不同的层级。合成监控不是一刀切的。不同的测试类型用于不同的目的,成熟的监控策略结合了多种测试类型。
可用性 / 运行时间监控
运行时间监控使用网络和端点探针确认服务器或服务是否可达并响应。这些检查在不同的网络层运行,每层验证不同的内容:
- Ping 监控(ICMP) — 在防火墙规则允许的情况下测试对主机的基本网络可达性。通过 Ping 确认主机在线,但不代表应用程序健康。
- 端口监控(TCP) — 测试特定端口是否开放并接受连接。确认传输层的可达性。
- HTTP/HTTPS 运行时间检查 — 在应用层验证应用端点,检查状态码、响应内容和 SSL 有效性。对于应用程序运行时间,带有响应和内容断言的 HTTP 检查是最有意义的监控层。
Dotcom-Monitor 提供三种不同的产品 — Ping 监控、端口监控和基于 HTTP 的运行时间监控 — 因为通过 Ping 并不保证应用健康。
浏览器 / 页面性能监控
真实浏览器加载完整网页 — 执行 JavaScript,渲染 CSS,加载第三方资源 — 并记录细粒度的加载时间。Dotcom-Monitor 的网页监控运行在真实的 Chrome、Edge、Firefox 及移动浏览器(40 多种配置)中,而不仅是无头引擎,产生反映实际用户体验的真实性能数据。关键指标包括 TTFB、FCP、LCP、DOM 加载时间和总页面加载时间。瀑布图和与图表同步的视频录制帮助你准确定位最慢的资源。这对 SEO 很重要:谷歌的核心网页指标(LCP、CLS、INP)是排名因素,一贯的低分会影响你的搜索可见性。
事务监控
事务监控模拟完整用户旅程 — 多步骤序列,如搜索产品、加入购物车、输入支付信息及完成结账。Dotcom-Monitor 的 EveryStep Web Recorder 通过记录真实浏览器交互捕获这些旅程,并进行回放 c通过监控代理持续进行。任何中断步骤——无法提交的表单、因 UI 变更而错位的按钮、部署引入的重定向循环——都会被立即捕获。这是保护关键收入业务流程最强大的测试类型。
API 监控
测试 REST 和 SOAP API 端点的健康状况、性能和正确性。验证 HTTP 方法(GET、POST、PUT、PATCH),检查响应状态码,核实响应负载,并测量延迟。Dotcom-Monitor 支持 REST API 监控、SOAP API 监控、Postman Collection 监控和 Insomnia Collection 监控——涵盖团队实际使用的全类型 API。多步骤 API 测试将多个请求(认证 → 创建 → 获取 → 删除)链式连接,用于验证完整工作流程。SSL/TLS 证书检查可与 API 测试同时运行,以确保证书有效且未接近到期。
DNS 监控
验证您的 DNS 服务器是否正确解析主机名且响应时间在可接受范围内。DNS 问题可能导致广泛且难以诊断的故障——当 DNS 失败时,即使您的服务器运行正常,用户也无法访问您的应用。Dotcom-Monitor 的 DNS 监控验证解析准确性、响应时间以及全球位置的完整 DNS 传播链健康状况。它还验证 DNSSEC 链信任,确保 DNS 响应未被篡改,监控 SOA 记录一致性,并标记异常 DNS 变化——例如意外 IP 地址或未经授权的记录修改——可能表明错误路由或缓存投毒。DNS 监控支持 A、AAAA、MX、NS、CNAME、PTR 和 SOA 记录类型。
SSL 证书监控
跟踪 SSL/TLS 证书的有效性、到期日期和吊销状态。过期或配置错误的证书会在每个浏览器中立即触发信任警告,直接影响用户信任和转化率。自动化 SSL 监控会在证书到期前几天或几周提醒您,给予团队时间续订,避免停机。
协议和网络监控
除了 Web 和 API 检查外,Dotcom-Monitor 还监控完整的网络协议栈:电子邮件(SMTP、POP3、IMAP)、VoIP 和 SIP、FTP、UDP、WebSocket 和 traceroute 路径分析。Ping 监控(ICMP)和端口扫描补充了网络层可视性。这些测试对于运行复杂基础设施且应用健康依赖多个底层服务的组织尤为重要。
3 个关键合成监控指标

你测量什么,就能改善什么。最重要的运营合成监控指标分为三类:
可用性指标
- 正常运行时间百分比(目标:根据SLA达到99.9%或更高)
- 按端点和地理区域划分的错误率
- HTTP状态码(4xx客户端错误,5xx服务器错误)
- DNS解析成功率和响应时间
- SSL/TLS证书有效性及距离过期天数
性能指标
- 首字节时间(TTFB)——服务器响应速度
- 首次内容绘制(FCP)和最大内容绘制(LCP)——核心网页指标
- 累计布局偏移(CLS)——视觉稳定性
- 交互到下一帧绘制时间(INP)——响应性核心网页指标(实验室测量值近似现场值)
- 总体页面加载时间和DOM加载时间
- API响应时间(p50,p95,p99延迟)
- 事务步骤时间——多步骤流程中哪个步骤最慢
可靠性及SLA指标
- 平均检测时间(MTTD)——在探测间隔内问题被捕获的速度
- 平均修复时间(MTTR)——问题被修复的速度
- 滚动时间窗内的SLA/SLO合规百分比
- 性能基线差异——响应时间相较历史平均的变化
合成监控 vs.真实用户监控 vs. APM
这三种监控方法是互补的,而非竞争的。这三种监控方法各自服务于不同目的,常被混淆。以下是它们的区别:
| 维度 | 合成监控 | 真实用户监控(RUM) | APM |
|---|---|---|---|
| 数据来源 | 代理的脚本模拟 | 实际用户会话(JS片段) | 后端插装(追踪,日志) |
| 数据采集时间 | 全天候,按定义的探测计划 | 仅在真实用户活跃时 | 实际应用执行期间 |
| 类型 | 主动 / 前瞻性 | 被动 / 反应性 | 内部 / 代码级 |
| 最适用场景 | 正常运行时间,回归检测,SLA验证 | 真实用户体验,地理性能, 会话分析 | 根因分析,代码级瓶颈 |
| 适用发布前 | 是 | 否 | 是(在预发布环境) |
| 在低流量时段工作? | 是 | 有限 | 是,但请求越少=样本越少 |
| 覆盖第三方服务? | 是(API 和 DNS 测试) | 部分 | 取决于监控工具 |
| 捕捉未知用户路径? | 否(仅脚本) | 是 | 部分 |
关键见解:合成监控和真实用户监控(RUM)是互补的,而非竞争关系。合成监控为你提供一致的、主动的基准测量。RUM 告诉你多样真实用户在各种设备、浏览器和网络条件下发生了什么。两者结合使用可为你呈现完整的数字体验全貌。
应用性能监控(APM)处于不同层级,提供代码级追踪和服务器端性能数据。三者合力构成涵盖用户体验和后端性能的全面监控覆盖。对于完整可观测性实践,团队通常将 APM 与日志、指标和分布式追踪结合使用,以支持根因分析。
团队使用合成监控的原因:8 大关键优势
- 在用户发现问题之前捕获问题。合成测试持续运行,即使在非工作时间。你会在凌晨2点知道结账流程故障,而无需等客户醒来发现问题。
- 建立性能基准。通过重复运行相同测试,构建可靠的预期性能基准。超出定义阈值的偏差——在多个地点或连续时间点确认——可触发警报,过滤掉暂时的网络噪声。
- 快速验证新部署。在上线前对预发布环境运行合成测试,确认无误后上线,随后继续监控生产环境表现——在影响真实用户之前捕获回归。
- 保护 SLA 和 SLO。合成监控生成持续、客观的性能数据,帮助你向客户证明 SLA 合规性,并快速识别第三方供应商不达标情况。
- 追究第三方供应商责任。现代应用依赖 CDN、支付处理器、分析平台和 SaaS API。合成测试可独立监控这些,提供供应商性能下降影响用户的证据。
- 缩短平均修复时间(MTTR)。由于合成检查捕获一致的步骤、计时和工件——包括与 Dotcom-Monitor 瀑布图同步的视频录制——通常更有助于重现和诊断问题。间歇性或状态依赖故障可能仍需更深入的服务器端调查,但拥有确切步骤序列…e 和时间显著缩小了搜索范围。
- 监控预发布和低流量区域。 在新地域上线?构建尚未投入生产的新功能?合成监控可以在任何真实用户访问这些区域之前对其进行测试。
- 支持容量规划。 历史合成监控数据揭示趋势:随着用户群的增长,您的 API 是否变慢?高峰流量期间是否导致性能下降?这些数据直接用于容量和基础设施规划决策。
按团队和行业划分的合成监控用例
按团队划分
- SRE 和平台团队: 负责正常运行时间 SLO。使用合成监控跟踪 SLO 燃烧率,设置错误预算,并在违反 SLA 阈值之前获得警报。
- DevOps 和应用工程团队: 在发布验证过程中,对预发布环境运行合成检查。部署后监控以快速捕获回归,减少回滚决策时间。
- API 和后端团队: 监控 REST 和 SOAP API 端点的可用性、延迟和正确性。运行多步骤 API 测试,将认证、CRUD 操作和验证按顺序串联起来。
- 电子商务和数字体验团队: 保护结账流程、产品搜索和账户登录。监控核心网页指标,保护用户体验和 SEO 排名。电子商务研究显示加载时间延迟会对转化产生可衡量的影响——尽管具体阈值因行业、用户期望和基线性能而异。
按行业划分
- 金融服务: 监控网上银行平台、支付网关和交易系统的可用性及亚秒响应时间。持续验证 SSL/TLS 配置。
- 医疗技术: 确保电子健康记录系统、患者门户和远程医疗平台的可访问性和性能——在高需求期间尤为关键。
- 电子商务和零售: 监控库存 API、购物车功能和结账流程的持续可用性。
- 媒体和流媒体: 验证 CDN 性能、推荐引擎的 API 端点和流媒体服务的可用性。
- 公共部门: 监控面向市民的门户和服务,必须维持公共 SLA 中定义的可用性承诺。
合成监控的 7 大挑战与限制
合成监控是一种强大的工具,但每个团队都应了解其实际限制。
- 脚本覆盖盲区: 合成测试只覆盖您已编写脚本的用户路径。不同用户路径、设备配置、网络条件、应用状态和边缘环境的组合
- 测试脆弱性:基于浏览器的事务脚本对 UI 变化非常敏感。当按钮文本变化、表单字段重命名或页面结构重组时,测试可能会失败——即使应用程序本身运行正常。这会产生警报噪音并需要持续维护。
- 维护开销:随着应用程序的发展,测试脚本也必须跟着调整。对于频繁发布的大型应用,保持脚本更新是一项实际的运营成本。
- 无主观用户体验信号:合成监控衡量的是客观指标:响应时间、错误率、可用性。它无法捕捉用户满意度、视觉设计问题、无障碍性问题或混乱界面的主观感觉。
- 模拟条件与现实不同:合成代理运行于受控环境中。它们可能无法复现真实用户设备的多样性、带宽变化的移动网络、企业代理或区域 ISP 路由。
- 后端盲点:合成监控是一种自外向内的视角。它告诉您应用程序运行缓慢,但无法在代码层面说明原因。代码级根因分析需要 APM 和分布式追踪。
- 规模成本:从多个全球位置频繁运行复杂交易脚本的测试可能成本高昂,尤其是随着代理数量、测试频率和数据保留需求的增长。
用例创建了一个组合空间,全面编写脚本是不切实际的。真实用户监控通过捕捉实际用户遇到的情况填补了这一空白。
9 条合成监控最佳实践

- 从你的关键路径开始。不要试图一次测试所有内容。先从直接驱动收入或受 SLA 覆盖的 3-5 个用户旅程开始:登录、结账、核心 API 以及访问量最高的着陆页。
- 从用户所在地进行监控。从真实用户所在的地理区域运行测试。美国东部节点通过的测试不会告诉您东南亚或西欧的性能情况。Dotcom-Monitor 的 30 多个全球节点让您能将代理位置与用户地理位置匹配。
- 在内部环境中使用私有代理。对于防火墙后的服务——内部 API、内联网和应用程序,预发布环境——在您的网络内部署私有代理。请记住:私有代理通过测试只能确认该特定服务从该视角是可用的,而不能说明您的整个内部环境是健康的。
- 设定有意义的警报阈值。 根据您建立的性能基线配置警报条件——例如,当响应时间超过基线平均值的1.5–2倍,或可用性低于您的SLO阈值时发出警报。Dotcom-Monitor支持可配置的过滤器,使您可以针对每个检查调整敏感度,而不是对每次波动都报警。
- 在上线前验证预发布环境。 在每次发布前,使用Dotcom-Monitor对您的预发布环境运行检查,以便及早发现回归问题。部署后,立即监控生产环境30–60分钟——这是大多数部署相关问题出现的时间段。利用Dotcom-Monitor的警报集成(Slack,PagerDuty)将部署后的警报直接路由到您的值班团队。
- 将测试脚本保存到版本控制中。 将监控脚本视为代码。将它们存储在Git中,通过拉取请求审查更改,并在脚本更新导致误报时回滚。
- 结合RUM实现全方位覆盖。 使用合成监控进行主动检测和基线测量。在此基础上叠加RUM,以捕获实际用户在不同条件下的真实体验。这两者结合提供了对您数字体验的全面监控覆盖。
- 定期分析瀑布图。 不要只看总加载时间。检查瀑布图,查看哪些单独资源——第三方脚本、大图片、慢速API调用——对加载时间贡献最大。Dotcom-Monitor结合视频抓取与瀑布图同步,大大加快了诊断速度。
- 重大版本发布后审查并更新脚本。 每次重要的UI变更或API重构后,审核您的合成测试脚本,确保它们仍然反映准确的用户旅程,且未被发布版本破坏。
如何分析合成监控数据?
收集合成监控数据只有在您采取行动时才有价值。以下是将原始测试结果转化为性能改进的实用工作流程:
- 每天查看可用性和错误率仪表盘。 寻找模式:错误是否集中在特定区域、特定端点或特定时间?
- 追踪性能趋势,而不仅仅是某一时点快照。 比如,今天某页面加载时间是2.1秒,但之前是13周前的0.6秒有回归——即使尚未超过您的警报阈值。
- 使用瀑布图和视频定位瓶颈。 识别每个页面上最慢的资源。Dotcom-Monitor的录像与瀑布图同步,准确显示浏览器在故障期间的体验——无需猜测。
- 将合成失败与部署事件相关联。 当测试开始失败时,检查您的部署日志。故障发生前不久的发布是一个强烈信号,值得优先调查。
- 对反复出现的故障进行根本原因分析(RCA)。 不仅仅是解决警报——还要记录它们。特定地区或特定时间反复出现的故障模式,通常表明存在值得积极解决的系统性基础设施问题。
- 定期报告SLA/SLO合规情况。 使用历史合成监控数据为利益相关者和客户生成正常运行时间报告。客观、带时间戳的数据建立信任,并在与第三方供应商产生争议时至关重要。
合成监控工具应具备哪些功能?
并非所有合成监控平台都一样。在评估解决方案时,请关注以下功能:
- 全球监控网络 —— 超过30个地点,便于从用户实际所在位置测试
- 支持私有代理 —— 在您自己的网络内部署代理,用于内联网和预发布环境监控
- 广泛的测试类型覆盖 —— 单一平台支持正常运行时间、浏览器、事务、API(REST、SOAP、Postman、Insomnia)、DNS、SSL及协议检查
- 真实浏览器测试 —— 在实际的Chrome、Edge、Firefox及移动浏览器中运行监控,而非仅使用无头引擎
- 可视化调试工具 —— 瀑布图、与监控运行同步的视频录像及电影条截图,快速诊断
- 灵活的脚本录制 —— 使用EveryStep Web Recorder等工具捕捉真实用户交互,无需手写自动化脚本
- 性能指标深度 —— TTFB、FCP、LCP、CLS、INP及完整导航时间细分
- 警报集成 —— 支持PagerDuty、Slack、Teams、电子邮件、短信、WhatsApp及Webhook,配合值班工作流程
- 按需触发检查 —— 可通过API运行检查,支持作为发布工作流程的一部分触发监控
- SLA/SLO仪表盘 —— 内置正常运行时间及性能承诺报告,支持共享仪表盘
- 透明定价 —— 成本可预测模型可根据您的需求进行扩展
使用 Dotcom-Monitor 开始合成监控
Dotcom-Monitor 提供企业级合成监控,拥有来自全球30多个监控地点的网络,支持正常运行时间检查、真实浏览器页面测试、通过 EveryStep Web Recorder 进行的事务监控、API 监控(REST、SOAP、Postman、Insomnia)、带有 DNSSEC 验证的 DNS 监控、SSL 证书监控,以及一整套协议检查——所有功能集中在一个平台中。
无论您是在保护电子商务结账流程、监控面向公众的 API、验证企业客户的 SLA 合规性,还是保持团队的内部应用程序运行,Dotcom-Monitor 都能为您提供主动的可见性,帮助您在问题影响真实用户之前检测并解决它们。
今天开始您的免费30天试用——无需信用卡。