So erstellen Sie Geräte und Aufgaben

Der MetricsView Linux-Überwachungsdienst ermöglicht die Überwachung von Linux-Computern oder Servern und ermöglicht es Benutzern, Schwellenwerte für Daten aus
Collectd-Leistungsindikatoren
festzulegen und Warnungen festzulegen, wenn diese Schwellenwerte überschritten werden.

Nachdem Sie ein Gerät erstellt, den Linux-Agenten installiert und eine benutzerdefinierte Collector-Aufgabe hinzugefügt oder bearbeitet haben, werden Sie aufgefordert, die folgenden Einstellungen anzupassen:

Sammler

MetricsView Collectors ermöglicht die Datenerfassung von Erfassten Leistungsindikatoren von Zielcomputern.

Um mit der Aufgabe zu beginnen, müssen Sie den Collector-Agent angeben, der als Überwachungsziel für die Aufgabe verwendet wird:

  • Wenn bereits ein Collector-Agent eingerichtet wurde, wählen Sie den Namen des Collector-Agenten in der Liste Vorhandene Kollektorverwenden oder Neu installieren aus.
  • Wenn in der Liste keine Collectors vorhanden sind, klicken Sie auf Neu installieren, um einen neuen Collector einzurichten.

Der Linux-Zählerpfad spiegelt den relativen Pfad zum Leistungsindikator im Quellsystem [local or remote machine] wider: [category] [instance] [counter type] Der Zählerpfad wird automatisch basierend auf den Werten generiert, die in den Dropdown-Dropdowns Hostname/Kategorie/Instanz/Counter ausgewählt wurden.

Beispiel

Linux-Zählerpfad: .. Im Leerlauf von scpu-0-cpu-idle

Hostname

Geben Sie eine IP- oder einen Namen des Zielcomputers an, auf dem MetricsView Linux Agent (Collectd) installiert ist.

Zählerkategorie

Wählen Sie Gruppierungskriterien der 1. Ebene (z. B. CPU) aus.

Zählername

Wählen Sie Gruppierungskriterien der 2. Ebene aus (z. B. CPU-#2 Last).

Counter-Instanz

Wählen Sie Gruppierungskriterien der dritten Ebene aus (z. B. CPU-Kernnummer).

Siehe Zählerbeschreibungen am Ende des Artikels.

Fehlerschwellenwerte

  • Aggregat: Alle empfangenen Daten werden regelmäßig entsprechend der angepassten Gerätefrequenz aggregiert.
    • Maximum – der höchste Wert aus dem Array wird genommen.
    • Durchschnitt – Wert wird als Durchschnitt aller Zwischenwerte berechnet.
    • Minimum – der niedrigste Wert aus dem Array wird genommen.
  • Min Schwelle: Die Überschreitung des Schwellenwerts führt zu einer Warnung.
  • Max Schwelle: Die Überschreitung des Schwellenwerts führt zu einer Warnung.
  • Ignorieren, wenn nicht verfügbar: Jedes Mal während “Agent” < — > “Server” Interaktion Agent fragt, ob es neue Leistungsindikatoren für Agent zu überprüfen. Falls es Anweisungen gibt, um Statistiken auf neuen Zählern zu sammeln, beginnt Agents, sie zu sammeln. Falls NO ausgewählt wurde, wird jeder Fehler in der Counter-Abfrage als Fehler in Berichten widergespiegelt, falls JA ausgewählt wurde – Fehler werden ignoriert.

Task UID

Die UID ist eine eindeutige ID, die für jede Aufgabe generiert wird. Diese ID wird verwendet, um eine Schnittstelle mit der Aufgabe in der APIzu verwenden.

Zählerbeschreibungen

CPU

CPU-Plugin sammelt die Zeit, die von der CPU in verschiedenen Staaten verbracht, vor allem die Ausführung von Benutzercode, die Ausführung von Systemcode, warten auf IO-Operationen und im Leerlauf. https://collectd.org/wiki/index.php/Plugin:CPU

cpu-interrupt :: Spiegelt die Zeit wider, die der Prozessor mit der Wartung von Interrupts verbracht hat

cpu-wait :: Für eine bestimmte CPU ist es die Zeit, in der sich diese CPU im Leerlauf befand (d. h. keine Aufgaben ausgeführt wurde) und es gab mindestens einen ausstehenden Datenträger-E/A-Vorgang, der von einem Task angefordert wurde, der auf dieser CPU geplant war (zum Zeitpunkt der Generierten dieser E/A-Anforderung).

cpu-system :: ist die Zeit, die die CPU damit beschäftigt war, Code im Kernel-Raum auszuführen (https://en.wikipedia.org/wiki/Kernel_space).

cpu-softirq :: Für ein besseres Verständnis von Softirqs empfehlen wir die Überprüfung von Matthew Wilcox’ Artikel “I’ll Do It Later: Softirqs, Tasklets, Bottom Halves, Task Queues, Work Queues, and Timers

cpu-steal :: (nur für das gesamte System), auf virtualisierter Hardware, ist die Zeit, die das Betriebssystem ausführen wollte, aber vom Hypervisor nicht zugelassen wurde. Dies kann passieren, wenn auf der physischen Hardware mehrere Gastbetriebssysteme ausgeführt werden und der Hypervisor sich entschieden hat, einem anderen einen CPU-Zeitfenster zuzuweisen.

cpu-nice :: Der “nette” CPU-Prozentsatz ist der Prozentsatz der CPU-Zeit, die von Prozessen auf Benutzerebene mit einem positiven Wert belegt wird. Für weitere Details siehe   Mann schön
 
in Konsole

cpu-user :: ist die Zeit, die die CPU damit beschäftigt war, Code im Benutzerbereich auszuführen (https://de.wikipedia.org/wiki/User_space).

interface

if_errors-rx :: Rate der auf der Schnittstelle aufgezeichneten Lesefehler
if_octets-rx :: Rate der von der Schnittstelle gelesenen Oktette
if_octets-tx :: Rate der Oktette, die auf die Schnittstelle geschrieben wurden
if_packets-tx :: Rate der pakete, die auf die Schnittstelle geschrieben wurden
if_errors-tx :: Rate der auf der Schnittstelle aufgezeichneten Schreibfehler
if_packets-rx :: Rate der von der Schnittstelle gelesenen Pakete

df (space usage)

df_complex frei :: Bytes frei auf Festplatte
df_complex reserviert :: Bytes reserviert für root (Linux-Dateisysteme reservieren oft einen kleinen Prozentsatz der Gesamtfestplatte

Kapazität für den Root-Benutzer, das System vor Nicht-Root-Benutzern zu schützen, die die
Dateisystem)

df_complex verwendet :: Bytes, die auf dem Datenträger verwendet werden

disk (Disk I/O)

disk_time:: Zeit (in Millisekunden) des Zuschreibens des Datenträgers
disk_ops gelesen :: Gesamtanzahl der vom Datenträger ausgeführten Lesevorgänge
disk_ops:: Gesamtanzahl der vom Datenträger ausgeführten Schreibvorgänge
disk_octets:: Rate der auf die Festplatte geschriebenen Oktette
disk_time lesen :: Zeit (in Millisekunden) des Zulesens des Datenträgers
disk_merged:: Die Anzahl der Schreibvorgänge, die vom Kernel zusammengeführt wurden (da sie

angrenzend)

disk_merged lesen :: Die Anzahl der Lesevorgänge, die vom Kernel zusammengeführt wurden (da sie

angrenzend)

disk_octets lesen :: Rate der von der Festplatte gelesenen Oktette

memory

speichergepuffert :: Der “gepufferte” Speicher ist Speichermenge, die von Linux zum Puffern von Netzwerk- und Datenträgerverbindungen verwendet wird.

Zwischengespeichert :: Die meisten Linux-Distributionen verwenden jeden verfügbaren kostenlosen RAM, um den Zugriff auf Dateien auf der Festplatte zwischenzuspeichern, was hilft, den Festplattenzugriff zu beschleunigen. Wenn das System nicht auf freiem Speicher verfügt, werden diese Daten automatisch aus dem RAM gelöscht, um Platz für Programme und andere wichtige Daten zu schaffen.
Verwendeter Speicher :: die Gesamtmenge des vom System genutzten Speichers
speicherfrei :: die Gesamtmenge des freien Speichers im System