ArtikelVirtualisierung

Unified DWH/DL – Komplexe Daten-Infrastrukturen leichter verwalten

Autor/Redakteur: Otto Neuer, Regional VP Sales bei Denodo/gg

Der Erfolg von Unternehmen wird in Zukunft vermehrt davon abhängen, ob sie in der Lage sind, sich all ihre Daten bestmöglich zunutze zu machen. Führungskräfte können sich nicht mehr alleine auf ihren Instinkt verlassen, wenn sie wichtige Geschäftsentscheidungen treffen, sondern brauchen eine faktenbasierte Grundlage. Für die Speicherung und Verarbeitung dieser Datenbestände kommt vielerorts ein Data Warehouse (DWH) oder Data Lake (DL) zum Einsatz. Die zunehmende Komplexität der Daten sowie neue Bedürfnisse bei ihrer Verarbeitung übersteigen allerdings immer häufiger die Möglichkeiten herkömmlicher Architekturen. Die Lösung: ein Unified DWH/DL.

Bild: Denodo

Über einen Mangel an Daten kann sich heute kein Unternehmen mehr beschweren – im Gegenteil: die Vielzahl an Datenquellen und großen Mengen an Daten machen es für immer mehr Organisationen notwendig, diese in einem Data Warehouse oder Data Lake zusammenzuführen, um mit ihnen zu arbeiten. So gab im aktuellen TDWI-Report Building the Unified Data Warehouse and Data Lake mehr als die Hälfte (53 Prozent) der befragten Analytics- und Datenexperten an, auf ein On-Premises Data Warehouse zu setzen. Jeweils 36 Prozent nutzen bereits ein Data Warehouse oder ein Data Lake in der Cloud, während knapp ein Viertel (23 Prozent) über einen Data Lake On-Prem verfügt. Auch hier gewinnt die Cloud zunehmend an Bedeutung für Unternehmen, wobei etwa die Hälfte derjenigen mit einem Data Warehouse in der Cloud ihren Data Lake auch in der Cloud betreiben (und umgekehrt).

Data Warehouses und Data Lakes nähern sich an

Data Warehouses sind zentrale Datenbankplattformen, die für die Analyse von Daten und insbesondere für Business-Reportings optimiert wurden. Daher sind sie in der Lage, Daten aus verschiedenen Quellen zu einem gemeinsamen konsistenten Datenbestand zusammenzuführen. Data Lakes dienen dagegen dazu, Informationen aus unterschiedlichen Quellen in ihrem ursprünglichen rohen Format in einem zentralen Repository zusammenzuführen. Dort können diese Daten allerdings auch bereinigt, angepasst und umgewandelt werden, um sie beispielsweise für Advanced Analytics oder Machine Learning zu verwenden oder um sie für die weitere Verarbeitung in einem Data Warehouse vorzubereiten.

Bild: Denodo

Unternehmen nutzen Data Lakes heute auch schon oft als Ergänzung zum Data Warehouse, zum Beispiel um große Mengen an IoT-Daten zu speichern und mittels Visualisierungstools zu analysieren. Tatsächlich nähern sich Data Warehouses und Data Lakes mittlerweile so weit an, dass sie mancherorts bereits zum einem Unified Data Warehouse/Data Lake (Unified DWH/DL) verschmelzen. Zwar verfügen bislang nur wenige Unternehmen über diese neue Architektur, aber die große Mehrheit der Befragten (89 Prozent) sieht sie für die Zukunft als Chance.