ADMIN

2022

09

2022-08-30T12:00:00

Datenbanken und Applikationen

PRAXIS

056

Storage

Datenbank

Datenmanagement

Datenmanagement mit Enterprise-Search-Werkzeugen

Alles auf dem Radar

von Manuel Brunner

Veröffentlicht in Ausgabe 09/2022 - PRAXIS

In Zeiten von Big Data und der täglichen Arbeit mit vielen verschiedenen Daten aus den unterschiedlichsten Quellen können Unternehmen schnell den Überblick über Speicherorte und Zugangsberechtigungen verlieren. Schlaue Enterprise-Search-Werkzeuge schaffen nicht nur in diesen Fällen Abhilfe, sie leisten auch in Sachen Compliance wichtige Arbeit und dienen als hilfreiche Grundlage für Verzeichnisdienste.

Es ist ein bekanntes Problem in Unternehmen: Die Präsentation für das nächste Meeting steht an, die Deadline rückt näher, aber nicht alle benötigten Daten sind auf die Schnelle auffindbar. Mitarbeiter durchsuchen ihre E-Mails, File Shares und die vielen verschiedenen Serverebenen. Eine zeitraubende Aufgabe. Und obwohl diese und ähnliche Probleme tagtäglich Ressourcen und Mitarbeiter binden, gilt die oft erfolglose unternehmensinterne Suche nach Daten und Dokumenten in vielen Fällen immer noch als unausweichliches Übel.
Es gibt jedoch flexible und moderne Tools, die genau diese Suchen ermöglichen, dabei die jeweiligen Berechtigungen überprüfen und einhalten sowie den Mitarbeitern beziehungsweise den Anwendergruppen Rechte zuweisen. Die Rede ist von Enterprise-Search-Werkzeugen, die Unternehmen in vielfacher Hinsicht einen Mehrwert bieten und einen passenden technologischen Unterbau für skalierbare und sichere Verzeichnisdienste bieten.
Eine Suche für alle Fälle
Suchmaschinen sind seit langer Zeit ein gängiges Tool bei der Nutzung des Internets. Enterprise-Search-Werkzeuge arbeiten ganz ähnlich, durchforsten aber nicht nur das Web, sondern alle angebundenen Datenquellen eines Unternehmens. Dafür muss die Technologie die unterschiedlichsten Datensilos zusammenführen, einzelne Daten auf den Inhalt prüfen, indexieren und verifizieren, ob der Nutzer die Berechtigung hat, das zu sehen, was er sucht.
Es ist ein bekanntes Problem in Unternehmen: Die Präsentation für das nächste Meeting steht an, die Deadline rückt näher, aber nicht alle benötigten Daten sind auf die Schnelle auffindbar. Mitarbeiter durchsuchen ihre E-Mails, File Shares und die vielen verschiedenen Serverebenen. Eine zeitraubende Aufgabe. Und obwohl diese und ähnliche Probleme tagtäglich Ressourcen und Mitarbeiter binden, gilt die oft erfolglose unternehmensinterne Suche nach Daten und Dokumenten in vielen Fällen immer noch als unausweichliches Übel.
Es gibt jedoch flexible und moderne Tools, die genau diese Suchen ermöglichen, dabei die jeweiligen Berechtigungen überprüfen und einhalten sowie den Mitarbeitern beziehungsweise den Anwendergruppen Rechte zuweisen. Die Rede ist von Enterprise-Search-Werkzeugen, die Unternehmen in vielfacher Hinsicht einen Mehrwert bieten und einen passenden technologischen Unterbau für skalierbare und sichere Verzeichnisdienste bieten.
Eine Suche für alle Fälle
Suchmaschinen sind seit langer Zeit ein gängiges Tool bei der Nutzung des Internets. Enterprise-Search-Werkzeuge arbeiten ganz ähnlich, durchforsten aber nicht nur das Web, sondern alle angebundenen Datenquellen eines Unternehmens. Dafür muss die Technologie die unterschiedlichsten Datensilos zusammenführen, einzelne Daten auf den Inhalt prüfen, indexieren und verifizieren, ob der Nutzer die Berechtigung hat, das zu sehen, was er sucht.
Dabei kann der Suchvorgang verschiedenste Formate wie PowerPoint-Präsentationen, ZIP-Dateien, Bilder, E-Mails oder klassische Word-Dokumente miteinbeziehen – alle Daten, die das Unternehmen indexieren lässt. Hier sollten für Mitarbeiter nur die Daten auffindbar sein, für die sie entsprechende Zugriffsrechte besitzen. Die Vergabe von Rechten ist daher ein zentraler Aspekt, der dank moderner Technologie den Unternehmen die nötige Sicherheit bietet.
Um zu gewährleisten, dass sensible Daten nur für wirklich berechtigte Personen sichtbar sind, greifen gute interne Suchmaschinen auf das Konzept des "Early Bindings" zurück. Dabei wird dem Benutzer bei seiner Anmeldung im System eine bestimmte Rolle beziehungsweise eine Anwendergruppe zugewiesen. Meist geschieht dies durch Security Identifier (SID). Bei der Indexierung, also der Aufnahme in den Suchindex, weist das Unternehmen den einzelnen Dateien in der Access Control List (ACL) Zugriffsrechte zu. Diese Informationen bringt das Enterprise-Search-Tool schließlich wie in einem Steckersystem zusammen und kann mit dieser Kombination gewährleisten, dass nur berechtigte Personen sensible Daten in der Trefferliste sehen können und darauf Zugriff haben.
Wichtig ist der Einsatz des Early-Binding-Konzeptes, um performante Komfortfunktionalitäten ebenfalls rechtegeprüft anzubieten, wie zum Beispiel die Autovervollständigung oder eine unscharfe Suche, bei der sogar Rechtschreibfehler oder ähnlich klingende Begriffe Berücksichtigung finden.
Entlastung für IT-Administratoren
Die massenhaften Suchanfragen auf Fileservern von Mitarbeitern per Desktopsuche verursachen bei herkömmlichen Systemen im Vergleich zu einer Enter-prise-Search-Anwendung ein Tausendfaches an Datenlast. Der Grund: Das wiederholte Zugreifen auf geteilte Ordner und einzelne Objekte sowie deren lokale Indexierung auf der Festplatte führt zu gewaltigen Lasten in den Systemen. Administratoren sind gut beraten, dieser Praxis frühzeitig einen Riegel vorzuschieben.
Genau hier kommen moderne Suchmaschinen ins Spiel, die diese Arbeit nicht nur übernehmen, sondern die auch ohne großen technischen Aufwand einsetzbar sind. Voraussetzung dafür ist eine Java-Umgebung auf dem Server, ein Benutzer mit Installationsrechten, ein Account mit Berechtigung zum Lesen von Dokumenten beziehungsweise Dateien sowie Zugriff auf den LDAP-Server, um die Gruppenberechtigungen auszulesen.
Besonders interessant sind dabei Suchmaschinen, die Push-Konnektoren mitbringen. Auf diese Weise lösen Änderungen wie das Bearbeiten, Löschen oder Ablegen von Dokumenten einen Trigger aus. Das System verfolgt die URL und indexiert die Datei automatisch innerhalb von wenigen Sekunden.
Ein großer Vorteil dabei ist, dass das aufwendige und zeitintensive Iterieren der Quellsysteme auf der Suche nach Änderungen, auch crawlen genannt, entfällt und das System entlastet wird.
Die Daten werden also nicht nach und nach aktualisiert, sondern in Echtzeit. Diese Vorgehensweise beugt einem anderen großen Problem vor – dem nicht aktuellen Index. Denn wenn Mitarbeiter die abgelegten Dokumente erst nach Tagen oder Wochen über die Suche finden können, entspricht das nicht dem heutigen Verständnis von Usability.
Bei der technischen Umsetzung haben Unternehmen, die ihre Daten über eine leistungsfähige interne Suchmaschine verwalten und suchen wollen, keine großen Installationsprozesse zu befürchten. Die mit den Konnektoren vernetzten Datenquellen eröffnen die Datenlandschaft, die ein mit universalen Rechten ausgestattetes Profil durchforstet. Dieser "Benutzer" erhält bei der Konfiguration die Erlaubnis, Dokumente zu öffnen, zu lesen und zu schließen. Alle Meta-Attribute der Dokumente bleiben dabei mit Ausnahme des Last Access Date unverändert.
Von Technologie bis Linguistik und KI
Wer das gesamte Potenzial und Können von Enterprise-Search-Werkzeugen verstehen will, muss in die Details unter der Haube schauen. Hier lassen sich zwei Bereiche unterscheiden: ein technischer und ein linguistisch KI-basierter.
Technisch gesehen arbeitet moderne Suchsoftware wie etwa der iFinder von IntraFind mit Elasticsearch und einer Vielzahl an Konnektoren, die aus zwei wesentlichen Komponenten bestehen. Einerseits holen sie die hinterlegten Zugriffsrechte bei der Indexierung von Dateien ein, andererseits fragen sie die zugewiesenen Berechtigungen für den einzelnen Nutzer ab, wenn dieser die Suche aufruft. Dabei können Unternehmen verschiedene Zugriffslimitierungen neben der rechtegeprüften Suche als Basis-Zugriffssteuerung vornehmen, um projektspezifische Sichtbarkeits- oder auch Datensicherheitsanforderungen umzusetzen.
So können zum Beispiel auch Dokumente, die einzelne Trigger-Wörter beinhalten, grundsätzlich oder für bestimmte Benutzergruppen nicht in den Trefferlisten auftauchen. Enterprise-Search-Werkzeuge bieten im Gegensatz zu standardmäßigen Fileshare-Management-Systemen neben einem höheren Komfort in der Regel auch bessere Analysemöglichkeiten und eine einfachere Bedienung für die Erfüllung aller Anforderungen an modernes Datenmanagement.
Der zweite Bereich moderner Suchsoftware umfasst die automatisierte Analyse der indexierten Dokumente. Für eine qualitativ hochwertige Trefferliste müssen sich nicht nur die eingegebenen Begriffe im Index wiederfinden und in der Trefferliste wieder anzeigen lassen, sondern das Ziel sollte sein, dem Benutzer eine vollständige und nach adaptiver Relevanz sortierte Trefferliste zu liefern. Dafür wird ein linguistisch normalisierter Index aufgebaut, der neben den sogenannten Vollformen auch die zugehörigen Grundformen und die sinntragenden Einzelwortbestandteile (bei zusammengesetzten Begriffen) enthält. So beinhalten die Ergebnisse der Suche nach "rechtegeprüft" Treffer zu der Formulierung "Prüfung der Rechte". Die Linguistik sorgt auf diese Weise dafür, dass keine relevanten Treffer außen vor bleiben.
Nach der linguistischen Normalisierung kommen dann zahlreiche KI-Verfahren zum Einsatz. So werden damit personenbezogene Daten erkannt, Dokumente mit Machine-Learning-Verfahren definierten Themen zugeordnet und über die Erkennung von Use-Case-relevanten Datenpunkten und Findings die gesamte Informations- und Dokumentenlandschaft automatisch miteinander vernetzt und auch Query Understanding ermöglicht.
Trefferliste eines modernen Enterprise-Search-Werkzeugs am Beispiel des iFinder von IntraFind.
Compliance erleichtern
Natürlich ist das schnelle Suchen und Finden von benötigten Daten für Mitarbeiter ein großer Anwendungsbereich von Enterprise-Search-Produkten. Daneben wird aber auch ein anderer Use Case immer wichtiger: Die Compliance-Suche. Nach Inkrafttreten der DSGVO sind Unternehmen gut beraten, sensible Daten rechtskonform zu speichern und einen Überblick über die vorhandenen Informationen zu behalten. Bei Millionen oder sogar Milliarden von Dokumenten kann das schnell zu einer Herausforderung werden.
Das unrechtmäßige Speichern von personenbezogenen Daten kann – selbst wenn es nicht vorsätzlich geschieht – empfindliche Strafen nach sich ziehen. Der Einsatz von Suchtools zum Auffinden dieser toxischen Datensätze wird daher immer entscheidender. Das auf diese Weise eingesetzte Analysetool gibt IT-Administratoren und Datenschützern die Sicherheit, keine blinden Flecken in den Unternehmensdaten zu haben, wie es auf herkömmlichen Fileservern oft der Fall ist.
Der Vorteil von Suchmaschinen mit linguistisch-normalisierten Indexen: Personenbezogene Daten wie Namen, Telefonnummern, Bankdaten oder Adressen sind mit den entsprechenden Rechten einfach recherchierbar. Dabei beinhaltet die Trefferliste alle möglichen Schreibformen, etwa bei Abkürzungen oder E-Mail-Adressen. Dank dieser erweiterten Abfrage-Möglichkeit finden Personaler, Administratoren und Datenschützer schnell besonders sensible Dokumente, die sehr viele personenbezogenen Daten enthalten und können sie entsprechend vor Zugriffen Unbefugter schützen oder löschen.
Für einige Anwendergruppen reicht es daher nicht aus, nur die eigenen Rechte zu verwenden – in besonderen Fällen müssen befugte Personen die Möglichkeit haben, auf alle Unternehmensdaten zugreifen zu können. Diese Art Universalschlüssel unterliegt extremen Sicherheitsvorkehrungen, wie etwa einer Dreifaktor-Authentifizierung und einem Sechs-Augen-Prinzip. Der Vorteil gegenüber externen Konzepten: Es muss kein Administrator kontaktiert werden.
Weitere wichtige Anwendungsfälle von Enterprise-Search-Diensten sind beispielsweise die Erkennung von Löschfristen, von Geheimhaltungsstufen oder der für ein Dokument gültige Exportkontrollvorschrift. Umfassendes Datenmanagement, Kontrolle über die eigenen Daten und deren Transparenz stellen Unternehmen zunehmend vor schwierig zu bewältigende Aufgaben. Enterprise Search kombiniert mit KI-basierter Textanalyse, der Fähigkeit zur Indexierung sowie der Analyse von Milliarden von Dokumenten die genau hierfür erforderlichen Eigenschaften.
Fazit
Suchmaschinen für Unternehmen geben Sicherheit – sowohl für Datenschützer, die einen aktuellen Überblick über die gespeicherten Dokumente und deren Inhalt haben wollen, als auch für IT-Administratoren, die mit relativ geringem Aufwand ein leistungsfähiges Analyse- und Search-Werkzeug an die Hand bekommen.
Der IT-Administrator kann also erstmalig aufgrund von aussagekräftigen und intelligent angereicherten Metadaten inhaltsbasierte Entscheidungen treffen – und das vollautomatisiert. Dank umfangreicher Sicherheitsvorkehrungen erlaubt die Software das rechtlich einwandfreie Suchen nach Unternehmensdaten und erspart den Mitarbeitern viel Zeit und Ärger.
(ln)
Manuel Brunner ist Partner und Key Account Manager bei der IntraFind Software AG.