Gerade in größeren IT-Landschaften sind häufig mehrere Monitoringsysteme zu finden. Admins nehmen dann eine redundante Konfiguration auf mehreren Plattformen vor. Das kostet viel Zeit und führt oft nicht zur gewünschten Übersicht. Umbrella-Monitoring führt die Daten vieler Überwachungssysteme in einem zentralen Werkzeug zusammen. Wir zeigen, welche Tools sich für diesen Einsatzzweck eignen und wie sie sich unter eine Haube bringen lassen.
Umbrella-Monitoring zeichnet sich durch eine umfassende Perspektive auf sämtliche Aspekte einer IT-Umgebung aus. Es erfasst und analysiert nicht nur die klassischen Hardwarekomponenten, Betriebssysteme und Netzwerke, sondern darüber hinaus auch Anwendungen, Datenbanken, Nutzererfahrungen und eine Fülle von weiteren Elementen. Ein entscheidendes Merkmal des Ansatzes besteht darin, dass er weitere Monitoring- und IT-Service-Management/Enterprise-Service-Management-Systeme (ITSM/ ESM) in die Betrachtung einbezieht.
Die grundlegende Idee dahinter ist, die komplexen Zusammenhänge zwischen den verschiedenen Elementen der IT-Infrastruktur zu verstehen. Dies geht weit über das einfache Erfassen von Metriken hinaus und ist von entscheidender Bedeutung, da Probleme oft nicht isoliert auftreten, sondern sich auf verschiedene Teile des Gesamtsystems auswirken können. Der Ansatz hilft, diese Zusammenhänge zu erkennen, sodass das IT-Team frühzeitig auf potenzielle Probleme reagieren kann, bevor sie sich auf die Gesamtleistung auswirken.
Insgesamt soll Umbrella-Monitoring also eine proaktive Herangehensweise an die Überwachung und Verwaltung der IT-Infrastruktur erlauben. Es kann damit erheblich dazu beitragen, Ausfallzeiten zu minimieren, die Gesamtleistung zu optimieren und die Zuverlässigkeit der IT-Dienste zu erhöhen. Viele Unternehmen setzen dies mit einem Open-Source-Toolstack um. In der Regel besteht er aus einer Kombination der nachfolgend genannten Systeme.
Umbrella-Monitoring zeichnet sich durch eine umfassende Perspektive auf sämtliche Aspekte einer IT-Umgebung aus. Es erfasst und analysiert nicht nur die klassischen Hardwarekomponenten, Betriebssysteme und Netzwerke, sondern darüber hinaus auch Anwendungen, Datenbanken, Nutzererfahrungen und eine Fülle von weiteren Elementen. Ein entscheidendes Merkmal des Ansatzes besteht darin, dass er weitere Monitoring- und IT-Service-Management/Enterprise-Service-Management-Systeme (ITSM/ ESM) in die Betrachtung einbezieht.
Die grundlegende Idee dahinter ist, die komplexen Zusammenhänge zwischen den verschiedenen Elementen der IT-Infrastruktur zu verstehen. Dies geht weit über das einfache Erfassen von Metriken hinaus und ist von entscheidender Bedeutung, da Probleme oft nicht isoliert auftreten, sondern sich auf verschiedene Teile des Gesamtsystems auswirken können. Der Ansatz hilft, diese Zusammenhänge zu erkennen, sodass das IT-Team frühzeitig auf potenzielle Probleme reagieren kann, bevor sie sich auf die Gesamtleistung auswirken.
Insgesamt soll Umbrella-Monitoring also eine proaktive Herangehensweise an die Überwachung und Verwaltung der IT-Infrastruktur erlauben. Es kann damit erheblich dazu beitragen, Ausfallzeiten zu minimieren, die Gesamtleistung zu optimieren und die Zuverlässigkeit der IT-Dienste zu erhöhen. Viele Unternehmen setzen dies mit einem Open-Source-Toolstack um. In der Regel besteht er aus einer Kombination der nachfolgend genannten Systeme.
Checkmk
Bei Checkmk handelt es sich um ein umfangreiches Monitoringtool, das besonders für die Überwachung von IT-Infrastrukturen und Applikationen bekannt ist und eine breite Palette von Plattformen und Geräten unterstützt – von Servern bis hin zu Netzwerkgeräten.
Mit der automatisierten Entdeckung von Hosts und Services sowie einer leistungsfähigen Alarmierungs- und Reporting-Funktion ermöglicht Checkmk eine schnelle und gezielte Reaktion auf Vorfälle. Es bietet eine hohe Skalierbarkeit und lässt sich durch eine umfangreiche API und zahlreiche Integrationen weiter anpassen und mit anderen Werkzeugen verzahnen.
Icinga2
Icinga2 ist eine skalierbare und modulare Software für die Überwachung von IT-Infrastrukturen, die sowohl für kleine als auch für sehr große Landschaften geeignet ist. Ein zentraler Aspekt ist das verteilte Monitoring, da Icinga2 Überwachungsaufgaben auf mehrere Instanzen verteilen kann, um so große und komplexe Infrastrukturen effizient im Blick zu behalten.
Die Plattform bietet leistungsstarke APIs, die eine Automatisierung des Monitorings und nahtlose Integration in andere Systeme zulässt. Die flexible Konfiguration und zahlreichen modularen Erweiterungsmöglichkeiten erlauben eine präzise Anpassung an die jeweiligen Anforderungen eines Unternehmens. Eine benutzerfreundliche Oberfläche und umfangreiche Visualisierungen ergänzen das Tool.
openITCOCKPIT
openITCOCKPIT ist ein Multi-Mandanten-Framework für die Infrastruktur- und Applikationsüberwachung. Es ist leicht zu konfigurieren, ermöglicht das zentrale Monitoring von Servern, Netzwerken und Anwendungen und bietet eine übersichtliche Darstellung der Systemzustände. Ähnlich wie Icinga2 umfasst es ein modulares Konzept mit Modulen für Eventkorrelation, Reporting und vielem mehr.
Ein Feature von openITCOCKPIT ist die Möglichkeit des Umbrella-Monitorings, mit dem sich Informationen aus anderen Systemen wie Icinga2, PRTG und weiteren Tools sammeln und gemeinsam überwachen lassen. Durch diese Funktion hebt sich das Tool vom klassischen IT-Infrastruktur- und Applikationsmonitoring ab.
Thruk
Thruk fungiert als eine benutzerfreundliche Weboberfläche für Naemon/Nagios-basierte Tools, die speziell für die Visualisierung und Verwaltung von Überwachungsdaten entwickelt wurde. Es bietet eine zentralisierte Ansicht von Naemon/Nagios-Instanzen und lässt sich sowohl für Checkmk als auch für andere Nagios-Derivate wie Icinga2 und Shinken nutzen.
Thruk ermöglicht eine einfache Navigation durch Hosts, Services und Alarme und bietet leistungsstarke Reporting- und Benachrichtigungsfunktionen. Durch die Unterstützung von Benutzerrollen und Mehrbenutzerbetrieb eignet es sich besonders für den Einsatz in großen, komplexen Landschaften, in denen mehrere Teams und Nutzer auf die gleichen Daten zugreifen müssen.
Prometheus mit Grafana
Prometheus gilt als leistungsstarkes, metrikbasiertes Monitoringtool, das sich insbesondere für die Überwachung von Infrastrukturen in der Cloud und mikroservicebasierten Architekturen eignet. Es bietet eine hohe Skalierbarkeit und speichert Zeitreihendaten effizient, während es Daten in Echtzeit abruft und verarbeitet. Mit seiner flexiblen Abfragesprache (PromQL) lassen sich komplexe Metriken schnell analysieren. Prometheus lässt sich nahtlos in andere Systeme integrieren und bietet ein leistungsstarkes API zur Automatisierung und Erweiterung der Überwachungsfunktionen.
Aufgrund seiner spartanischen Oberfläche erfolgt die Visualisierung häufig in Kombination mit Grafana. Dabei handelt es sich um eine Open-Source-Visualisierungsplattform, die sich vor allem für die Darstellung von Zeitreihendaten und metrischen Informationen eignet. Sie kann neben Prometheus mit weiteren Datenquellen wie InfluxDB oder Elasticsearch arbeiten, um diese in interaktiven, anpassbaren Dashboards zu visualisieren. Auf der benutzerfreundlichen Oberfläche lassen sich komplexe Metriken und Trends übersichtlich darstellen, um tiefere Einblicke in die Systemleistung zu gewinnen.
Über Schnittstellen lassen sich im OpenITCOCKPIT-Framework weitere Monitoringsysteme integrieren und zahlreiche Datenquellen anbinden.
Toolkombinationen können mehr
Insbesondere die Tools Grafana und Prometheus sind in den Toolstacks durch ihren starken Fokus auf Visualisierung und Cloudmonitoring unerlässlich und interagieren mit nahezu allen bestehenden Überwachungswerkzeugen. Prometheus fungiert dabei als metrikbasiertes System, das besonders auf die Anforderungen der Cloud ausgelegt ist und sich damit vom klassischen IT-Infrastruktur- und Applikationsmonitoring abhebt. Grafana hingegen ist ein Meister der Visualisierung und kommt für ein ansprechendes Dashboarding zum Einsatz beziehungsweise dient als Erweiterung für bestehende Ansichten.
Damit lässt sich in Kombination mit einem der genannten Werkzeuge ein Toolstack aufbauen, der die nahezu vollständige Überwachung der Unternehmens-IT erlaubt. Um die Infrastruktur dabei effizient und automatisiert in das Überwachungssystem zu integrieren, setzen viele Unternehmen auf eigene Skripte oder Configuration-Management-Anwendungen wie Ansible, Saltstack oder Chef, die über die APIs der einzelnen Tools automatisch Konfigurationen erstellen. Zusätzlich kommen oft auch Build-in-Funktionalitäten der Monitoringtools zum Einsatz oder spezielle Konfigurationsgeneratoren wie coshsh. Diese helfen dabei, Hosts aus einer CMDB (Configuration Management Database) zu extrahieren und automatisch mit den entsprechenden Services zu verknüpfen.
Trotz der hohen Funktionalität und Flexibilität dieses kombinierten Ansatzes gibt es einige Nachteile: Für den Betrieb des gesamten Toolstacks ist in der Regel ein umfassendes Fachwissen in allen verwendeten Systemen erforderlich. Diese Komplexität kann dazu führen, dass der Betrieb und die Wartung des Systems schnell anspruchsvoll und zeitintensiv werden.
Umbrella-Monitoring mit openITCOCKPIT
Als Projekt mit einem starken Fokus auf das Thema Umbrella-Monitoring setzt openITCOCKPIT an genau der Stelle an, an der die Komplexität der herkömmlichen Toolstacks zu einer echten Herausforderung für Unternehmen wird. Die Software verfolgt das Ziel, den Betrieb und die Verwaltung der IT-Überwachung so einfach wie möglich zu machen. Durch die Integration von Grafana, Checkmk und Prometheus über deren Schnittstellen erlaubt das Framework nicht nur die zentrale und benutzerfreundliche Verwaltung dieser leistungsstarken Tools, sondern übernimmt für den Anwender auch alle notwendigen Konfigurationen.
Zudem bietet openITCOCKPIT die Option, Icinga2, PRTG sowie den opManager von ManageEngine als Datenquelle zu integrieren, sodass Unternehmen flexibel bei der Wahl ihrer Monitoringtools sind. Das Besondere ist, dass das Framework nicht nur Assets aus den angebundenen Tools extrahiert, sondern in regelmäßigen Abständen auch kontinuierlich deren Status sowie Performancedaten ohne die Notwendigkeit einer doppelten Überwachung übernimmt.
Diese ständige Erhebung sorgt dafür, dass die zentralisierten Daten aus allen Monitoringsystemen stets auf dem neuesten Stand ist und sich etwaige Probleme frühzeitig erkennen lassen. Besonders praktisch ist die Integration von Icinga2, bei der sogar eine Echtzeitübermittlung der Daten möglich ist. Dies gestattet eine unmittelbare Reaktion auf Veränderungen im Systemzustand, was für die zeitkritische Fehlerbehebung und das Performance-Management von unschätzbarem Wert ist.
Eine weitere Funktion von openITCOCKPIT ist das integrierte Importmodul, das es erlaubt, Daten aus verschiedenen Quellen wie i-doit, iTop, PRTG, Icinga2, opManager und CSV-Dateien direkt zu importieren. So lassen sich Bestandsdaten aus verschiedenen Systemen problemlos einbinden, ohne dass manuelle Eingriffe erforderlich sind.
Ein umfassendes Monitoring-Framework sollte nahtlos in die Unternehmenskommunikation integrierbar sein, weil es die Brücke zwischen technischer Infrastruktur und den geschäftlichen Anforderungen schlägt. Genau hier bietet openITCOCKPIT eine Vielzahl von Schnittstellen, die eine einfache Verbindung zu gängigen Ticketsystemen und Kommunikationsplattformen ermöglichen. So lassen sich mühelos Tools wie ServiceNow, Znuny/ OTRS, Microsoft Teams und viele weitere Dienste verbinden. Diese breite Konnektivität erlaubt es Unternehmen, ihre IT-Überwachung und Kommunikationsprozesse zentral und effizient zu steuern, wodurch Abläufe transparenter und schneller werden und Teams noch effektiver zusammenarbeiten können.
Fazit
Umbrella-Monitoring bietet weit mehr als nur die Möglichkeit, ein umfassendes Infrastruktur- und Applikationsmonitoring aufzubauen. Es eröffnet die Chance, eine ganzheitliche Überwachungsstrategie zu entwickeln, die alle relevanten Informationsquellen miteinander verknüpft. Indem verschiedene Datenquellen – von klassischen System- und Netzwerkmetriken über Applikationsdaten bis hin zu Cloud- und externen Services – zusammengeführt werden, entsteht eine einheitliche Sicht auf die gesamte IT-Landschaft.
Dieser integrierte Blick kann zu einer erheblichen Qualitätssteigerung der Überwachung führen, da alle relevanten Informationen zentral zusammenlaufen und sich in Echtzeit analysieren lassen. Durch die Zentralisierung und Automatisierung der Datenerhebung minimiert sich der Verwaltungsaufwand für die IT-Abteilung deutlich. Statt mehrere isolierte Systeme manuell zu pflegen und zu überwachen, ermöglicht ein gut implementiertes Umbrella-Monitoring eine vereinheitlichte und effiziente Verwaltung.
(ln)
Jens Michelsons ist Product & Community Manager openITCOCKPIT bei it-novum.