ArtikelCloud

So lassen sich Daten in der Hybrid Data Cloud verwalten

Autor/Redakteur: Daniel Metzger, Regional VP Central & Eastern Europe bei Cloudera/gg

Daten bilden die Grundlage jeder Digitalisierungsstrategie. Zudem ist ihr Schutz Gegenstand einiger (supra-) nationaler Gesetze und Bestimmungen. Dennoch überlassen viele Unternehmen diesen Schatz übereilt ihrem Public-Cloud-Anbieter.

Bild: Cloudera

Häufig priorisieren diese Unternehmen ihre Datenstrategie nicht. Sie spüren einen Nachholbedarf in Sachen Cloud und treiben sich selbst zur Eile an. Überschattet durch die dringende Definition einer Infrastrukturstrategie gerät die Datenstrategie in den Hintergrund. Dabei ist diese nicht nur in einer hybriden Cloud-Umgebung entscheidend.

Gefangen im Vendor Lock-in

Meist bleibt das Versäumnis zunächst unbemerkt und kommt erst ans Licht, wenn ein Unternehmen mit seinem Public-Cloud-Anbieter unzufrieden ist und einen Wechsel hin zu einem anderen Anbieter anstrebt. Hier stellt sich plötzlich die Frage, wie die Daten wieder zurück ins eigene Unternehmen gelangen können.

Wer seine Daten ohne durchdachte Strategie an einen Cloud-Provider übergibt, geht damit ein Risiko ein: Im Falle eines Anbieterwechsels werden oft nur die ursprünglich übermittelten Rohdaten zurückgegeben. Damit ist der Aufwand für das Vorbereiten und Anreichern der Daten im Zusammenhang mit Data-Mining-Aktivitäten größtenteils hinfällig. Die bearbeiteten Daten lassen sich häufig nur gegen Zahlung einer hohen Ablösesumme freikaufen. Für den Kunden bedeutet dies den Verlust seiner Datenhoheit, er wird zum „Gefangenen“ des Anbieters. Fachleute sprechen hier von einem Vendor Lock-in.

Hybrid Cloud mit Datensilos

Eine unzureichende Datenstrategie und Fokus auf die Cloud-First-Strategie machen sich bereits im laufenden Geschäftsbetrieb bemerkbar – dies gilt vor allem in hybriden Cloud-Umgebungen. Viele Unternehmen betreiben ihre IT mittlerweile in unterschiedlichen Deployment-Umgebungen gleichzeitig. Der Grund dafür ist, dass einige Daten und Anwendungen von Gesetzes wegen im Unternehmen bleiben müssen, wohingegen andere ausgelagert werden dürfen, jedoch teilweise nur innerhalb der EU. Bei den übrigen Daten spielen lediglich der Preis sowie die Anbieterverfügbarkeit eine Rolle. Daraus ergibt sich für die meisten Unternehmen die Nutzung einer Hybrid Cloud, welche im schlimmsten Fall auf viele Datensilos zugreifen muss. Dabei entstehen aufgrund von Redundanzen unweigerlich Mehrkosten.

Warum es Data First heißen muss

Vendor Lock-in und unnötiger Betriebs- und Speicheraufwand lassen sich jedoch vermeiden. Dazu müssen Unternehmen allerdings ein eigenes Datenmanagement aufbauen und betreiben. Auf diese Weise kann auch in einer hybriden Cloud-Umgebung die Hoheit über die eigenen Daten bestehen bleiben – egal, wo sich diese physisch befinden.

Zwar hat das viel zitierte Schlagwort „Cloud First“ sicher seine Berechtigung. Jedoch sollte es im Hinblick auf Kostenersparnis und Datenmanagement eigentlich heißen: „Data First“. Die Cloud-Strategie ergibt sich aus der Datenstrategie, nicht umgekehrt.

Vereinfacht ausgedrückt, setzt sich die Entwicklung einer Datenstrategie aus drei Schritten zusammen. An erster Stelle steht die Bestandsaufnahme: Über welche Daten verfügt das Unternehmen? In welchen Formaten liegen diese vor? Im zweiten Schritt gilt es, die Daten zu bewerten: Wie kritisch sind sie? Was tragen sie jeweils zum Unternehmenserfolg bei? Die Antworten führen zur dritten Phase, dem eigentlichen Datenmanagement: Wie ist mit den Daten umzugehen? Wie kann das Maximum aus ihnen herausgeholt werden?

Die Hybrid Data Cloud als Lösung

Zum Datenmanagement gehören neben Zugriffs- und Speicherkonzepten auch Themen wie Data Security und Compliance. Darin inbegriffen sind Zugangskontrollen und rollenbasierte Berechtigungskonzepte, Backup- und Desaster-Recovery-Strategie sowie ein Mechanismus, mit dem sich die Einhaltung von Datenschutz- und Privacy-Bestimmungen jederzeit überprüfen und absichern lässt. Vor allem aber muss sichergestellt sein, dass die benötigten Daten – von den Massendaten des Edge-Computing bis zu komplexen Machine-Learning-Algorithmen – stets zugänglich für das Unternehmen sind. Dabei darf es keine Rolle spielen, wo sie gehostet werden.

Verwaltung und Steuerung derart verteilter Daten sind jedoch alles andere als trivial. Erheblich leichter fällt diese Aufgabe mit einer Hybrid Data Cloud. Sie übernimmt die Komplexität und erlaubt es Nutzerinnen und Nutzern, sich auf Use Cases und Geschäftsmodelle zu konzentrieren.

Darüber hinaus verfügen fortschrittliche Datenplattformen über eine integrierte Compliance-Überwachung. Dazu zählt ein Control Panel, das automatisch prüft, ob sich ein Datentransfer im Einklang mit den jeweils gültigen Privacy-Bestimmungen befindet. So erleichtert es vor allem großen, international tätigen Unternehmen das Compliance-Management.

Aber auch für kleine und mittlere Unternehmen (KMUs) ist eine Hybrid Data Cloud von Vorteil. Zwar ist der Einsatz von Cloud-Lösungen abhängig von der jeweiligen Brache bei KMUs nicht so weit verbreitet, allerdings zeigt sich aktuell besonders im Mittelstand ein Trend in Richtung Cloud und SaaS-basierten Lösungen. Auch hier werden Daten generiert. Unternehmen müssen sich daher die Frage stellen, ab welcher Größenordnung ein Mehrwert aus den Daten entsteht und eine Datenstrategie notwendig wird.