ADMIN
2021
09
2021-09-01T12:00:00
Clientmanagement und Support
PRAXIS
048
IT-Automatisierung
Cloud
Cloud Computing und problemfreier Netzwerkbetrieb
Wolkiger Fehlerteufel
von Marco Speckert
Veröffentlicht in Ausgabe 09/2021 - PRAXIS
Eine enge Personalsituation, immer mehr Endgeräte, der Trend zum Home Office und nicht zuletzt der Gang in die Cloud – die Verwaltung von Unternehmensnetzen gestaltet sich für Administratoren zunehmend schwieriger. Kommt es dann noch zu einer Störung im Netzwerk, gelangt das NetOps-Team schnell an seine Grenzen. Der Artikel beleuchtet, wie die Reaktionskette bei Netzwerkproblemen aussehen sollte und wie Tools zur Netzwerkautomatisierung bei der Fehlerbehebung helfen können.

Cloudanbieter werben gern mit einem Plus an Flexibilität. Diese geht jedoch mit bestimmten Nachteilen beziehungsweise Herausforderungen an anderer Stelle einher. Hierzu zählt die Verwaltung der Cloudumgebungen selbst sowie der externen Verbindungen des Netzwerks und deren Automatisierung. Auf den ersten Blick mag das nicht sonderlich schwerwiegend erscheinen. Allerdings sind diese Faktoren maßgeblich, wenn es darum geht, den – bestenfalls – reibungslosen Netzwerkbetrieb zu gewährleisten.
NetOps-Team im Fokus
Für Netzwerkadministratoren sind Cloudressourcen daher eine nicht unerhebliche Herausforderung – das Netzwerk bildet das Rückgrat der IT. Daher ist es für die NetOps unerlässlich, sich zu überlegen, welche Schritte sie unternehmen müssen, um Netzwerkstörungen zu begegnen. Dies schließt neu hinzukommende Verbindungen in die Cloud ebenso mit ein wie die gerade in großen Netzwerken permanent hinzugefügten oder ausgetauschten Netzwerkkomponenten innerhalb der eigenen Einflusssphäre.
Unabhängig davon, wie umfassend ein Netzwerk geplant und aufgebaut wurde, lassen sich Fehler im Netzwerkbetrieb kaum ausschließen. Verantwortlich dafür sind eine Vielzahl von Faktoren, gerade wenn das Netzwerk komplexe Strukturen aufweist. Diese Komplexität wächst mit jeder weiteren Netzwerkverbindung in die Cloud. Unter IT-Profis herrscht die Annahme vor, dass heutzutage fast alle Organisationen auf technische Werkzeuge setzen, um Netzwerkstörungen schneller als jeder Administrator zu erkennen. Allerdings ist der Einsatz solcher Tools weitaus weniger weit verbreitet, als es gemeinhin den Anschein hat.
Cloudanbieter werben gern mit einem Plus an Flexibilität. Diese geht jedoch mit bestimmten Nachteilen beziehungsweise Herausforderungen an anderer Stelle einher. Hierzu zählt die Verwaltung der Cloudumgebungen selbst sowie der externen Verbindungen des Netzwerks und deren Automatisierung. Auf den ersten Blick mag das nicht sonderlich schwerwiegend erscheinen. Allerdings sind diese Faktoren maßgeblich, wenn es darum geht, den – bestenfalls – reibungslosen Netzwerkbetrieb zu gewährleisten.
NetOps-Team im Fokus
Für Netzwerkadministratoren sind Cloudressourcen daher eine nicht unerhebliche Herausforderung – das Netzwerk bildet das Rückgrat der IT. Daher ist es für die NetOps unerlässlich, sich zu überlegen, welche Schritte sie unternehmen müssen, um Netzwerkstörungen zu begegnen. Dies schließt neu hinzukommende Verbindungen in die Cloud ebenso mit ein wie die gerade in großen Netzwerken permanent hinzugefügten oder ausgetauschten Netzwerkkomponenten innerhalb der eigenen Einflusssphäre.
Unabhängig davon, wie umfassend ein Netzwerk geplant und aufgebaut wurde, lassen sich Fehler im Netzwerkbetrieb kaum ausschließen. Verantwortlich dafür sind eine Vielzahl von Faktoren, gerade wenn das Netzwerk komplexe Strukturen aufweist. Diese Komplexität wächst mit jeder weiteren Netzwerkverbindung in die Cloud. Unter IT-Profis herrscht die Annahme vor, dass heutzutage fast alle Organisationen auf technische Werkzeuge setzen, um Netzwerkstörungen schneller als jeder Administrator zu erkennen. Allerdings ist der Einsatz solcher Tools weitaus weniger weit verbreitet, als es gemeinhin den Anschein hat.
Fehler identifizieren und beheben
Hat der Netzwerk-Admin eine Störung festgestellt, muss er zunächst den Grund für den Fehler identifizieren. Hier ist es nötig, die Untersuchungen zum Aufspüren des Fehlers möglichst breit anzulegen und unterschiedlichste Faktoren zu berücksichtigen. Einzig auf diese Weise können die NetOps dafür Sorge tragen, die Ursache des Problems zeitnah zu finden. Erhalten die IT-Teams dabei keine Unterstützung durch ein passendes Automatisierungswerkzeug, gestaltet sich dieser Teil der Reaktionskette sehr zeitaufwändig und somit auch teuer. Die Kosten ergeben sich dabei aus der eingeschränkten Produktivität der Mitarbeiter und Systeme in dieser Phase.
Haben die Netzwerkprofis die Ursache der Störung einmal gefunden, ist deren Beseitigung vergleichsweise schnell erledigt. Allerdings können Werkzeuge zur Netzwerkautomatisierung auch hier ihre Stärken ausspielen und den Prozess abermals beschleunigen. Denn mittels hinterlegter Skripte lässt sich eine Behebung der Fehler automatisiert anstoßen, sofern es nicht des Austauschs von Komponenten bedarf. Eine Voraussetzung der Automatisierung ist hierbei, dass das IT-Team die jeweiligen Skripte anhand zuvor aufgetretener Fehler konfiguriert hat.
Die bislang geschilderte Vorgehensweise bezieht sich jedoch nur auf die direkte Einflusssphäre der NetOps, also das firmeneigene Netzwerk. Weitaus schwieriger gestaltet sich die Verwaltung und Fehlerbehebung, wenn eine Netzwerkstörung aufseiten der Public-Cloud-Infrastruktur auftritt. Doch auch dies muss das Netzwerkteam bei seinen Überlegungen berücksichtigen.
Public Cloud und Netzwerkautomatisierung
Viele Cloudprovider haben sich Transparenz auf die Fahnen geschrieben, um die Verwendung ihrer Infrastrukturen für die Kunden attraktiver zu machen. Folglich besteht die Möglichkeit, zumindest Teilaspekte der Netzwerkautomatisierung ebenfalls auf diese externen Bereiche auszuweiten. Derzeit umfasst dies fürs Erste die automatisierte Visualisierung der Komponenten in der Cloud, was sich durch entsprechende APIs realisieren lässt. Für Netzwerk-Admins bedeutet das, dass sie bei der Wahl ihrer Tools zur Netzwerkautomatisierung die Unterstützung für Public Clouds mit einbeziehen müssen – bestenfalls mit einem nahtlosen Übergang zwischen den verschiedenen Netzwerken.
Eine moderne Netzwerkautomatisierung deckt folglich alle Netzwerke und Komponenten des Unternehmens ab, sodass sich auftretende Störungen erkennen, überwachen, analysieren und gegebenenfalls automatisiert beheben lassen. Das Werkzeug muss dabei die folgenden Aspekte miteinbeziehen:
- das firmeneigene Netzwerk
- die Verbindungen zu den Mitarbeitern – insbesondere das mobile Arbeiten
- die Verbindung zu und in klassischen Rechenzentren
- Software-defined Networks (SDN)
- Software-defined Data Center (SDDC)
- Public-Cloud-Infrastrukturen
- sowie SD-WANs
Das Hauptaugenmerk der Netzwerkverantwortlichen sollte in Sachen Cloud vor allem der Möglichkeit gelten, AWS und Azure miteinzubeziehen. Denn zweifelsohne ist es für die Netzwerkautomatisierung zunehmend von Bedeutung, alle Instanzen und zugehörigen Komponenten zu berücksichtigen, die zu diesen beiden wichtigsten Public-Cloud-Plattformen gehören und vom eigenen Unternehmen genutzt werden. Aber auch andere Anbieter auf dem Gebiet der Public Cloud bieten nach und nach entsprechende Möglichkeiten zur Einbindung in Werkzeuge für das Netzwerkmanagement.
Darüber hinaus sollten Automatisierungstools für das Netzwerk dazu imstande sein, Änderungen an den Netzwerkkomponenten abzubilden. Dazu gehört, dass die Software erkennt und darstellt, welche Komponenten sich den physischen und welche den virtuellen Teilen des Netzwerks, also SDNs, zurechnen lassen. Sowohl das traditionelle Firmennetz sowie auch die Verbindungen zu Cloudplattformen müssen hier darstellbar sein, damit die Administratoren auf Anhieb erkennen können, wo die Trennlinien der einzelnen Abschnitte verlaufen.
Grenzen klar darstellen
In puncto Infrastrukturen außerhalb der Grenzen des eigenen Netzwerks sollten Netzwerkverantwortliche viele Informationen darüber besitzen, welche Architektur tatsächlich beim Cloudprovider implementiert ist. So sollten zumindest die Visualisierung und die Dokumentation der Komponenten möglich sein. Das eingesetzte Werkzeug sollte folglich die Option bieten, die verwendeten Elemente zu erkennen und übersichtlich darzustellen, sodass die Netzwerkadministratoren auf eine End-to-End-Übersicht zurückgreifen können. Diese ergänzt dann die Darstellung des eigenen Netzes um Informationen hinsichtlich der Cloudumgebung.
Kommt es nun zu einer Störung im Netzwerk, die sich außerhalb des eigenen Einflussbereichs ereignet, kann das Automatisierungstool, abhängig von der Rechtevergabe und der Konfiguration, aufgrund dieser Transparenz umgehend die NetOps aufseiten des Cloudanbieters benachrichtigen. So lässt sich der Prozess der Fehlerbehebung bedeutend schneller einleiten. Grund dafür ist die skizzierte netzwerkübergreifende Analyse, die mittels eines entsprechenden Werkzeugs automatisch erfolgt.
Application Assurance und Intent Based Networking
Ferner gilt es in Sachen Netzwerkautomatisierung noch, einen weiteren Aspekt in die eigenen Überlegungen miteinzubeziehen: den Einblick in die Verfügbarkeit von Anwendungen in und in Verbindung mit der Cloud. Damit ein Überblick darüber möglich wird, an welchem Ort sich welche Applikation befindet und wie deren Anbindung über das Netzwerk erfolgt, bedarf es einer sogenannten "Application Assurance". Diese kommt sowohl den NetOps wie auch allen anderen IT-Administratoren zugute.
Zusätzlich muss eine Netzwerkautomatisierung noch weitere Daten bereitstellen können. Dazu zählen nicht zuletzt Basisdaten der Netzwerkknoten der entsprechenden Public Cloud sowie Informationen hinsichtlich des CPU-Status und des Komponentenspeichers. Ferner sollten sich mittels Integration mit weiteren Cloudtools auch Daten zu Logs, Statistiken und Metriken einbeziehen lassen. Ist die entsprechende Automatisierungssoftware dazu nicht imstande, erhöht dies aufseiten der Netzwerkteams die für die Fehlersuche aufzuwendende Zeit.
Auch dem zunehmend verbreiteten Intent Based Networking (IBN), bei dem Admins nicht mehr manuell detailliert festlegen, wie eine Netzwerkverbindung mittels Adressen, Ports und Protokolle zustande kommt, sondern dies mittels der Definition von Zielen (Intents) erfolgt, sollte eine Automatisierungslösung Rechnung tragen. Dies geschieht im Regelfall über eine sogenannte Intent Based Automation (IBA), die im Gegensatz zum reinen IBN die Fähigkeit besitzt, kontextbezogene Echtzeitdaten aus dem täglichen Betrieb des Netzwerks zu nutzen, um kontinuierlich zu überwachen und zu verifizieren, dass das Netzwerk wie geplant funktioniert. Ist dies nicht der Fall, kommt es automatisch zu Intent-basierten Schritten zur Behebung der Störung.
Fazit
Nicht selten gestalten sich Fehlersuche und -behebung für die Netzwerkteams als Sisyphusarbeit, insbesondere wenn Störungen bei den Verbindungen in die Cloud auftreten. Der traditionelle Ansatz, die Fehlerquelle zu identifizieren und die Ursache zu beheben, lässt sich mit den bestehenden Personalressourcen kaum noch umsetzen. Mit dem Rückgriff auf Tools zur Netzwerkautomatisierung können IT-Teams dem jedoch begegnen. Insbesondere eine End-to-End-Transparenz über das ganze Netzwerk hinweg – auch unter Einbeziehung der genutzten Public-Cloud-Dienste – vereinfacht die Arbeit der NetOps und reduziert die aufzuwendende Zeit bei der Behebung von Fehlern.
(ln)
Marco Speckert ist Senior Pre-Sales Engineer bei NetBrain Technologies.