ADMIN
2025
09
2025-08-28T12:00:00
Storage-Management
SCHWERPUNKT
094
Künstliche Intelligenz
Datenmanagement
Datenreife für KI verbessern
Reiche Ernte
von Stephan Schulz
Veröffentlicht in Ausgabe 09/2025 - SCHWERPUNKT
Schon seit den Anfangstagen der Informationstechnologie gilt, dass gute Ergebnisse auf guten Eingaben basieren. Dass dies auch von großer Bedeutung für generative künstliche Intelligenz und fortgeschrittene, darauf aufbauende Methoden ist, haben die meisten IT-Verantwortlichen schon verinnerlicht. Doch oftmals bleibt die Frage unbeantwortet, wie der Weg zu einer deutlich erhöhten Datenreife und -qualität in der Praxis aussieht. Unser Artikel zeigt auf, wie Organisation eine stattliche Ernte reifer Datenfrüchte einfahren.

Bereits 96 Prozent der Unternehmen setzen heute künstliche Intelligenz in produktiven Umgebungen ein, so der "F5 State of Application Strategy Report 2025". Dies ist ein deutlicher Anstieg im Vergleich zu 2023, als nur 25 Prozent KI nutzten. Mithilfe der neuen Technologien wollen 72 Prozent der Befragten die App-Performance verbessern. Jeweils 59 Prozent der Befragten möchten durch KI Kosten senken und Sicherheitsregeln automatisiert anwenden, etwa um Zero-Day-Schwachstellen zu beheben.
Sorgen um Datenqualität
Gleichzeitig sorgen sich jedoch 96 Prozent der Unternehmen um Sicherheitsrisiken. 60 Prozent kämpfen mit manuellen Prozessen, 54 Prozent mit fehlenden KI-Fachkräften. Die viertgrößte Herausforderung mit 48 Prozent ist die Daten- qualität. So misstrauen 34 Prozent der Befragten den KI-Ergebnissen wegen möglicher Verzerrungen oder Halluzinationen, die unter anderem aufgrund einer unzureichenden Datenbasis für Training und Eingabe entstehen. In weiteren Umfragen bestätigen jeweils 65 bis 78 Prozent, dass eine unreife Datenbasis ein ernsthaftes Hindernis auf dem Weg zur Einführung von KI darstellt.
Tatsächlich ist die Datenbasis von allen Bereichen der Unternehmensarchitektur heute am stärksten von KI betroffen. Schließlich liegt der größte Vorteil von generativer KI in ihrer Fähigkeit, aus vorhandenen Informationen neue Daten zu erzeugen. Einige dieser KI-generierten Daten werden sogar für andere Aufgaben weiterverwendet – in Form von Code und Abfragen oder zum Vergleich von Ergebnissen, um neue Erkenntnisse zu gewinnen. Damit dies in der Praxis auch wirklich funktioniert, müssen aber schon die Trainings- und Eingabedaten vollständig sein und eine hohe Qualität besitzen. Mit einer unreifen Datenbasis werden Unternehmen dagegen schlechte Ergebnisse erhalten.
Bereits 96 Prozent der Unternehmen setzen heute künstliche Intelligenz in produktiven Umgebungen ein, so der "F5 State of Application Strategy Report 2025". Dies ist ein deutlicher Anstieg im Vergleich zu 2023, als nur 25 Prozent KI nutzten. Mithilfe der neuen Technologien wollen 72 Prozent der Befragten die App-Performance verbessern. Jeweils 59 Prozent der Befragten möchten durch KI Kosten senken und Sicherheitsregeln automatisiert anwenden, etwa um Zero-Day-Schwachstellen zu beheben.
Sorgen um Datenqualität
Gleichzeitig sorgen sich jedoch 96 Prozent der Unternehmen um Sicherheitsrisiken. 60 Prozent kämpfen mit manuellen Prozessen, 54 Prozent mit fehlenden KI-Fachkräften. Die viertgrößte Herausforderung mit 48 Prozent ist die Daten- qualität. So misstrauen 34 Prozent der Befragten den KI-Ergebnissen wegen möglicher Verzerrungen oder Halluzinationen, die unter anderem aufgrund einer unzureichenden Datenbasis für Training und Eingabe entstehen. In weiteren Umfragen bestätigen jeweils 65 bis 78 Prozent, dass eine unreife Datenbasis ein ernsthaftes Hindernis auf dem Weg zur Einführung von KI darstellt.
Tatsächlich ist die Datenbasis von allen Bereichen der Unternehmensarchitektur heute am stärksten von KI betroffen. Schließlich liegt der größte Vorteil von generativer KI in ihrer Fähigkeit, aus vorhandenen Informationen neue Daten zu erzeugen. Einige dieser KI-generierten Daten werden sogar für andere Aufgaben weiterverwendet – in Form von Code und Abfragen oder zum Vergleich von Ergebnissen, um neue Erkenntnisse zu gewinnen. Damit dies in der Praxis auch wirklich funktioniert, müssen aber schon die Trainings- und Eingabedaten vollständig sein und eine hohe Qualität besitzen. Mit einer unreifen Datenbasis werden Unternehmen dagegen schlechte Ergebnisse erhalten.
Quellen einer unreifen Datenbasis
Eine unreife Datenbasis bezeichnet im Zusammenhang mit KI nicht ausreichend entwickelte oder ungenügende Datenprozesse einer Organisation. Sie begrenzt ihre Fähigkeit, KI auf effektive Weise zu nutzen. Dies umfasst auch Probleme mit der Datenqualität, der Zugänglichkeit, der Governance und der Infrastruktur, zum Beispiel:
- Schlechte Datenqualität: Inkonsistente, unvollständige oder veraltete Daten führen zu unzuverlässigen Ergebnissen der künstlichen Intelligenz.
- Begrenzte Datenverfügbarkeit: Datensilos in verschiedenen Abteilungen behindern den Zugriff für eine umfassende Analyse und schränken damit die Ergebnisse ein.
- Unzureichende Datenverwaltung: Fehlende Richtlinien zu Dateneigentum, Compliance und Sicherheit führen zu Risiken und beeinträchtigen die KI-Nutzung.
- Schwache Dateninfrastruktur: Ungeeignete Tools und Umgebungen behindern die Datenverarbeitung und das Training von KI-Modellen im großen Maßstab.
- Unklare Datenstrategie: Das Fehlen einer klaren Strategie führt zu unkoordinierten Initiativen und einer begrenzten Fokussierung auf den Wert der Daten für KI.
Eine unausgereifte Datenbasis hindert somit Unternehmen daran, das volle Potenzial von KI zu nutzen. Denn hochwertige, gut verwaltete und zugängliche Daten bilden die Grundlage für die Entwicklung zuverlässiger und effektiver KI-Systeme. Unternehmen, die die Reife ihrer Datenbasis verbessern wollen, sollten entsprechend mit der Entwicklung einer Datenstrategie, der Umsetzung von Data-Governance-Richtlinien, Investitionen in die Dateninfrastruktur und der Verbesserung der Datenkompetenz in allen Teams beginnen.
Auswirkungen auf die KI-Einführung
Ohne die genannten Maßnahmen behindert eine unreife Datenbasis die Einführung von KI. Dieser Effekt ist bei vielen Unternehmen bereits in der Praxis zu erkennen. Sie haben größtenteils schon generative KI-Anwendungen wie Chatbots, Assistenten oder Co-Piloten eingeführt, die einfach umzusetzen sind und schnelle Erfolge versprechen. Bei dem Versuch, sich nun den höheren Mehrwert versprechenden Anwendungsfällen wie der Workflow-Automatisierung zuzuwenden, stoßen sie jedoch auf Probleme aufgrund unausgereifter Daten. So sinkt die Einführungsquote bereits wieder.
Organisationen, die der Datenreife keine hohe Priorität einräumen, können nur schwer fortschrittlichere KI-Funktionen nutzen und von KI-Automatisierungen profitieren. Zudem führt eine unreife Datenbasis zu einem Mangel an Vertrauen in die Analyseergebnisse und Vorhersagbarkeit der Ausführung. Das bremst alle Pläne, KI auf autonomere Weise zu nutzen – zum Beispiel für die Automatisierung von Geschäfts- oder Betriebsprozessen. Eine Studie des MIT Sloan Mana- gement Review aus dem Jahr 2023 unterstreicht, dass Unternehmen mit ausgereiften Datenmanagement-Prozessen mit 60 Prozent höherer Wahrscheinlichkeit bei der Workflow-Automatisierung erfolgreich sind als diejenigen, die derartiges nicht vorweisen können. Eine unreife Datenbasis schränkt die Genauigkeit der Vorhersagen und die Zuverlässigkeit von KI ein. Diese sind jedoch für autonome Funktionen wichtig, bei denen Entscheidungen ohne menschliches Eingreifen getroffen werden.
Unternehmen müssen daher zuerst ihre Daten in Ordnung bringen, bevor sie in der Lage sind, das Potenzial von KI zur Optimierung von Arbeitsabläufen zu nutzen. Nur dann können KI-Plattformen wirklich greifen und den Menschen wertvolle Zeit geben, um sich auf Strategie und Design zu konzentrieren.
Die Datenreife erhöhen
Die wichtigsten Schritte auf dem Weg zu einer höheren Datenreife sind:
- Entwicklung einer klaren Datenstrategie: Die Standards für Datenerfassung, -verwaltung und -qualität sind an den Unternehmenszielen auszurichten. Dies stellt sicher, dass die Daten KI-Projekte auf effektive Weise unterstützen.
- Implementierung einer soliden Datenverwaltung: Geeignete Richtlinien für Dateneigentum, Compliance, Sicherheit und Datenschutz verbessern nicht nur die Datenqualität, sondern erhöhen auch das Vertrauen in KI-Ergebnisse.
- Investitionen in eine skalierbare Dateninfrastruktur: Eine moderne Infrastruktur, wie Cloudspeicher und Daten-Pipelines, unterstützt eine effiziente Datenbearbeitung und ein skalierbares KI-Training.
- Verbesserung der Datenqualitätsstandards: Die Genauigkeit, die Konsistenz und die Vollständigkeit von Daten erfordern eine regelmäßige Überwachung und Bereinigung.
- Unternehmen sollten eine Kultur der Datenkompetenz und der Zusammenarbeit zwischen Datenverantwortlichen und den anderen Geschäftseinheiten fördern, um die Zugänglichkeit und den Wert von Daten zu verbessern.
Mit der Umsetzung dieser Best Practices lässt sich eine solide Datengrundlage für KI etablieren, die zu optimierten Arbeitsabläufen, geringeren Risiken und mehr Zeit für strategische Aufgaben führt. Denn eine hohe Datenreife ist nicht nur aus technischen Gründen notwendig. Sie bildet auch einen strategischen Vorteil, der es ermöglicht, das volle Potenzial von KI zu nutzen. Dann können Organisationen von grundlegenden KI-Anwendungen zu transformativen, wertorientierten Anwendungsfällen übergehen, um langfristig von KI zu profitieren.
Full-Stack-Observability als Erfolgsfaktor
Die Bedeutung einer hohen Datenreife lässt sich mit dem Prinzip der sogenannten Full-Stack-Observability erklären, also der Fähigkeit zur vollständigen Beobachtung eines Systems. Im herkömmlichen Sinne handelt es sich dabei um umfassende Informationen über operative Daten, also Telemetriedaten, die von der Netzwerk-, System- und Anwendungsinfrastruktur, den Anwendungsdiensten und den Anwendungen selbst erzeugt werden.
Diese Daten unterscheiden sich in Häufigkeit und Umfang von den traditionellen Quellen für Unternehmensinformationen. Es gibt jedoch Ähnlichkeiten, da die Daten aus verschiedenen Quellen oft miteinander verknüpft sind. Wie Kundeninfos umfassen Telemetriedaten sämtliche Anwendungsebenen – von der Infrastruktur über Anwendungsdienste bis hin zu APIs. Gerade die Beziehungen zwischen diesen Komponenten führen letztlich zu den eigentlichen Zusammenhängen und neuartigen Erkenntnissen.
Das Fehlen eines einzigen Telemetrie-Datensatzes kann schon den Unterschied zwischen einem Ausfall und der weiteren Betriebsfähigkeit ausmachen. Aus diesem Grund ist es für Unternehmen entscheidend, eine Full-Stack-Observability zu erreichen. Nur dann können auch KI-basierte Analysen zuverlässige Ergebnisse liefern. Dies allein garantiert jedoch nicht, dass ein Unternehmen daraus Erkenntnisse gewinnt. Dies hängt weitgehend von der Fähigkeit ab, Verbindungen zwischen unterschiedlichen Daten im gesamten System herzustellen. Das ist wiederum durch die Art der Datenspeicherung beeinflussbar, insbesondere ob diese in Silos erfolgt oder umfassende Zugriffe bietet. Nur letzteres ermöglicht Erkenntnisse, die eine Automatisierung vorantreiben.
Fazit
Generative KI erfordert eine umfassende Datenbasis. Das Erzeugen, Sammeln, Verarbeiten und Verwalten all dieser Daten – vom Betrieb bis hin zu geschäftlichen Anwendungsfällen – führt nicht nur im Bereich generative KI und Automatisierung zu neuen Prozessen, Ansätzen und Pipelines in Unternehmen. Eine hohe Datenreife verändert auch die etablierten Muster der Anwendungsarchitektur und im weiteren Sinne auch jeden anderen Unternehmensbereich. Dabei ist sicherzustellen, dass die Datenbasis in einem Tempo reift, in dem sich auch andere Firmenbereiche kontinuierlich weiterentwickeln. Denn schließlich sind auch diese – ebenso wie generative KI – von Daten abhängig.
(jp)
Stephan Schulz ist Senior Principal Solutions Engineer bei F5.