Как создавать устройства и задачи

Служба мониторинга MetricsView Linux позволяет осуществлять мониторинг компьютера или сервера Linux, а также позволяет пользователям устанавливать пороговые значения для данных
счетчиков
собираемой производительности и устанавливать оповещения при превышении этих порогов.

После того как вы создали устройство, установили Linux Agent и добавляете или редактируете пользовательскую задачу коллектора, вам будет предложено настроить следующие настройки::

коллектор

MetricsView Collectors позволяет собирать данные с счетчиков производительности Collectd с целевых компьютеров.

Для начала задачи необходимо указать коллекторный агент, который будет использоваться в качестве цели мониторинга для задачи:

  • Если агент коллектора уже настроен, выберите имя агента-коллекционера в существующем коллекторе или установите новый список.
  • Если в списке нет коллекторов, нажмите Install New, чтобы настроить новый коллектор.

Linux Counter Path отражает относительный путь к счетчику в системе [local or remote machine] источника: [category] [instance] [counter type] Встречный путь генерируется автоматически на основе значений, выбранных в Хост-имене/Категория/Инстанция/Встречные падения.

пример

Linux Встречный путь: .. «Cpu»0’cpu-idle

Имя хозяина

Предоставьте IP или имя целевой машины с установленным агентом MetricsView Linux (Collectd).

Счетчик Категория

Выберите критерии группировки 1-го уровня (например, процессор).

Имя счетчика

Выберите критерии группировки 2-го уровня (например, #2 процессора).

Встречная инстанция

Выберите критерии группировки третьего уровня (например, номер ядра процессора).

Смотрите описания счетчиков в конце статьи.

Пороговые значения ошибок

  • Агрегат: Все полученные данные будут агрегированы на регулярной основе, в соответствии с скорректированной частотой устройства.
    • Максимум – максимальное значение из массива будет принято.
    • Среднее – значение рассчитывается как среднее значение всех промежуточных значений.
    • Минимум – наименьшее значение из массива будет принято.
  • Порог мин: Превышение порога приведет к оповещению.
  • Максимальный порог: Превышение порога приведет к оповещению.
  • Игнорировать, если недоступен: Каждый раз во время < “Агент” – > “Сервер” взаимодействия Агент спрашивает, если есть какие-либо новые счетчики для агента, чтобы проверить. В случае, если есть инструкции по сбору статистики по новым счетчикам Агенты начинают их собирать. В случае выбора NO каждый сбой в опросе Counters будет отражен как ошибка в отчетах, в случае выбора YES – сбои будут проигнорированы.

Задача UID

UID является уникальным идентификатором, который генерируется для каждой задачи. Этот идентификатор используется для взаимодействия с задачей в API.

Встречные описания

CPU

Плагин процессора собирает количество времени, затученного процессором в различных состояниях, в первую очередь выполнение пользовательского кода, выполнение системного кода, ожидание IO-операций и простоя. https://collectd.org/wiki/index.php/Plugin:CPU

cpu-interrupt :: Отражает время, которое процессор потратил на обслуживание прерывания

cpu-wait :: Для данного процессора это время, в течение которого процессор простаивал (т.е. не выполнял никаких задач) и была по крайней мере одна выдающаяся операция диска I/O, запрошенная задачей, запланированной на этом процессоре (в то время, когда он генерировал этот запрос в режиме I/O).

cpu-system :: это количество времени, в течение которого процессор был занят выполнением кода в пространстве ядра (https://en.wikipedia.org/wiki/Kernel_space).

cpu-softirq :: Для лучшего понимания softirqs мы рекомендуем пересмотреть статью Мэтью Уилкокса “Я сделаю это позже: Softirqs, Tasklets, Нижняя половинки, Очереди задач, Очереди работы, и таймеры

cpu-steal :: (только для всей системы), на виртуализированном оборудовании, это количество времени, которое операционная система хотела выполнить, но не было разрешено гипервизором. Это может произойти, если физическое оборудование работает несколько гостевой операционной системы и гипервизор решил выделить временной интервал процессора на другой.

cpu-nice :: “Хороший” процент процессора – это % времени процессора, занятого процессами пользовательского уровня с положительным хорошим значением. Для получения более подробной информации,   пожалуйста, посмотрите человек хороший
 
в консоли

cpu-пользователь :: это количество времени, в течение которого процессор был занят выполнением кода в пользовательском пространстве (https://en.wikipedia.org/wiki/User_space).

interface

if_errors-rx :: Скорость чтения ошибок, записанных на интерфейсе
if_octets-rx :: Скорость октетов, прочитанных с интерфейса
if_octets-tx :: Скорость октетов, написанных на интерфейсе
if_packets-tx :: Скорость пакетов, написанных на интерфейс
if_errors-tx :: Скорость записи ошибок, записанных на интерфейсе
if_packets-rx :: Скорость пакетов, читаемых из интерфейса

df (space usage)

df_complex бесплатно :: Байты бесплатно на диске
df_complex зарезервировано :: Байты, зарезервированные для корневых (файловые системы linux часто резервируют небольшой процент от общего объема диска

для корневого пользователя для защиты системы от некореных пользователей, заполняя
файловая система)

df_complex используется :: Байты, используемые на диске

disk (Disk I/O)

disk_time-написать :: Количество времени (в миллисекундах) диск провел письменной форме
disk_ops читайте :: Общее количество операций чтения, выполняемых диском
disk_ops-написать :: Общее количество операций записи, выполняемых диском
disk_octets-написать :: Скорость октетов, написанных на диске
disk_time читайте :: Количество времени (в миллисекундах) диск провел чтение
disk_merged-написать :: Количество операций записи, объединенных ядром (потому что они были

смежные)

disk_merged читается :: Количество операций чтения, которые были объединены ядром (потому что они были

смежные)

disk_octets читайте :: Скорость октетов, прочитанных с диска

memory

буферизации памяти :: «Буферная» память — это объем памяти, используемый Linux для буферизации сети и подключения дисков.

памяти кэшированные :: Большинство дистрибутивов Linux будет использовать любой доступный бесплатный таран для кэша доступа к файлам на диске, что помогает ускорить доступ к диску. Когда система работает с низким уровнем свободной памяти он будет автоматически смыть эти данные из барана, чтобы освободить место для программ и других важных данных.
память используется :: общее количество памяти, используемой системой
без памяти :: общее количество свободной памяти в системе