什么是正常运行时间和 停机时间

通常,u ptime 值反映在指定时间段内测量的时间百分比,在此期间,Dotcom-Monitor 收到来自 监控世界各地的代理 d 自己的时间值反映在指定期间范围内测量的时间百分比,在此期间 Dotcom-Monitor 收到负响应

手动服务器正常运行时间/停机时间检查

有许多免费的商业和开源工具 解决方案可用,您可以使用它来检查 Web 服务器的状态和性能. 虽然这些工具非常适合检查 状态、响应时间和当时的性能,ha ving 手动运行测试以进行抽查 服务器错误 是耗时 和资源 消耗 并且只会在测试时给出结果。 发现任何错误 而运行手动测试可能影响你r 客户端的 ability 访问您的网站和 业务

自动正常运行时间/停机时间监控

服务器问题可能难以精确定位,而且修复时间可能非常耗时,因此时间非常长。发生 en 错误。 Ⅰ如果您尚未为服务器设置自动监视,并且会发生错误并继续 一个标志在被发现之前, 可能已经做了大量的时间。 自动化服务器 监控ing 和 设置主动 美国ptime/停机时间检查允许您持续和自动 设置莫尼托环 c赫克斯一个d 在停机发生时立即收到警报,让您的团队快速排除错误和酮p 您的客户 from 有 负用户 经验 或风险 F商业损失到 the 巴士iness 。

监控服务级别协议的遵守情况

此外,监控正常运行时间有助于确保服务提供商遵守其 SLA( 服务级别协议) 承诺。 了解有关 SLA 报告有关问题在 Dotcom 监视器解决方案中,请阅读我们的知识库文章,了解如何 创建 SLA 报告 SLA 报告是一个特殊的报告组,它为您提供在指定时间间隔内对 SLA 性能的单一视图。

如何为业务需求定义 停机时间

与 these 因素 ,下面是几个例子 考虑 如何定义停机时间。

  • 如果您每周 天晚上 定期对 Web 服务器进行维护,您的网站是否关闭?
  • 你有一个总部设在芝加哥的网络服务器无法从奥兰多,佛罗里达州因为你的服务提供商在奥兰多有问题,但它是从美国其他地区您的网站关闭?
  • 如果第三方托管元素(例如聊天小部件遇到服务器错误,但网站的其余部分可用,您的网站是否关闭?
  • 如果您的网站不能从世界上任何地方,由于服务器或其他一些服务器错误和最后s超过5秒您的网站是否关闭?
  • 如果你经营一个零售网站,购物车过程是正常工作,但不同的页面,例如你的关于我们页面,是没有加载,您的网站是否关闭?
  • 如果您的 DNS服务器 s关闭,但其他三个服务器正在工作,这相当于25% 客户端无法 缓存的实时时间 (TTL) 过期 后访问网站, 它被视为 向下状态 吗?
  • 如果 Web 服务器场中的三个 Web 服务器之关闭,并且页面响应时间增加了 10%, 25%,甚至50%的页面加载时间,考虑什么时候发生停机

没有人喜欢在半夜被叫或报警时 严重 出现停机问题。 如果初始答案 D自己的时间意味着醒来在 2 a.m. 解决问题, 上述问题的任何答案都改变了您的监控 方法或响应 因为它涉及到 美国ptime 和 D自己的时间?

正常运行时间/停机时间计算方法

计算正常运行时间或停机时间提供了一种仔细定义 Dotcom-Monitor 平台如何将响应解释为”向上”或”向下”响应的方法。这是通过使用筛选器来完成的。筛选器允许您为监视设备设置特定的条件和参数例如 监视持续时间任务失败、错误代码等。,用于监视代理。还可以使用筛选器来定义如何发送和接收警报,以 限制忽略虚假警报的数量,t可能会无意中被触发,以满足您的业务和监控环境的需求

顺便说一句,筛选器也可以应用于设备(切割错误触发)和任何类型的报告。

筛选使用以下 可调条件 定义向上/向下状态:

  • e rror 报告指定分钟数
  • error 由指定数量的A绅士确认
  • 指定数量的任务中检测到 e rror。

所有筛选器及其设置都可通过访问 配置筛选器 >. 将筛选器应用于监控设备后,所有监控设备的 通知基于筛选器的条件。

A default filter 分配给所有新的监控 装置s. 默认筛选器具有平衡配置,适用于大多数监控 设备

正常运行时间/停机时间计算

停机时间计算的数学公式如下所示。

停机时间

停机时间 持续时间直接与筛选器中的配置绑定。

  • 停机时间 期间从满足筛选器条件时开始。 例如,当 报告故障的绅等于筛选器中指定的 A根子数,并且也指定了满足分钟数和任务数的条件,然后发送停机时间警报。
  • 正常运行时间 当不再满足筛选器的条件时,期间开始。 特别 当报告 “u p”成功的 A根人、分钟或任务 时,正常运行时间开始 不再满足过滤的”向下”条件所需的条件。 例如,””错误数s “向下” 响应 通过监控 接收 士变得小于错误数, “向下”响应绅士需要,如过滤器中设置的,以指示”向下”条件。

未定义状态的持续时间

每个 A 的状态时,可以设置未定义状态参与监视的绅士变得未定义。 代理状态被视为未定义状态 如果 A gent在指定的时间长度内未提供任何响应(错误响应或成功响应),则未定义

响应等待时间 = (所有代理数+1) ×频率 = 15 分钟utes

例如, 如果我们考虑使用个监控 的情况 士和监控频率每5分钟 士会等待 35 分钟的答复 响应 等待时间的计算 如下:

响应等待时间 = (3+1) ×5 +15 分钟utes = 35 分钟utes

一旦时间过期,没有收到任何响应,Agent 将报告状态 未定义

延迟状态的持续时间

推迟 监视 设备 将随时停止任何监视活动,直到重新启用。

计划排除的持续时间

另一个可显著影响正常运行时间/停机时间计算的实体是 Schedules. Schedules 作为 管理监视的选项 代理 期间 常规 或 scheD乌莱德 维护。 监控可以推迟到一周的特定日期, 以及一天中的具体小时和分钟数。 要设置计划,请按照我们计划中的步骤操作,按照我们计划中的步骤操作 配置计划知识文章。

Any change in a 监测 装置 设置s, 包括 重新启动 监测 装置,向下 状态将重置状态,因此不会发送正常运行时间警报。

服务器正常运行时间/停机时间示例

例如,监视代理如何处理和响应正常运行时间或停机时间状态,假设我们有一个监视设备,该设备正在从七个位置进行监视,并且有一个筛选器集,其中三个位置必须在满足停机时间条件时报告错误。 此方案如下图所示。

example_regular

从上图中看, a 监测 节点 (A绅士 1) 检测到错误, 而其余的 代理 仍在报告成功富的响应. 下一个,第二个监视节点,代理 2, 检测到错误, 后面是来自 第三和最后 监视节点, 代理 4. 此最终错误响应,位于 中的 T4 点,触发筛选器以从这一刻开始设置停机时间。

向下状态将一直保留, 直到您设置一个 postpone 周期. 在此图中,我们设置了一个假设的延迟,位于点 T5,因为 在监视期间,A gent的报告错误数已满足三个监控设备的预定义 会话

图上点 T6 和 T7之间的时间差距说明了第一个响应包括延迟的事实 监控会话处理时间包括网络传输延迟和执行本身),因此”延迟”时间计算为 ∆ (T7+T5) 在图表上指示为“延迟2nd”)。

在这里我们陷入停机时间, 从代理3的第三个错误, 并恢复正常运行时间状态只 T9 响应,当故障代理数小于筛选器中调整时。 以下是此示例的最终停机时间百分比计算公式。

使用 Dotcom 监视器监控 正常运行时间和停机时间

自动化 监控正常运行时间和停机时间,您需要利用一个解决方案提供对基础设施 Health 和性能的端到端全面可视性,并提供功能,例如多个全局位置进行监视、配置特定计划、筛选器、即时警报、 报告 指标,等等所有这些 功能都为用户提供了 符合业务的要求和需求. T他Dotcom-Monitor平台提供所有这些基本功能,以及更高级的配置设置和第三方集成,所有这些都来自一个仪表板。了解更多来自 Dotcom-Monitor 的所有监控解决方案,以确保网站、API 和 Web 应用程序的24/7 正常运行时间。