ArtikelDatenverarbeitung/Big DataManagement

Graph-Technologie bringt neuen Schwung in traditionelle MDM Systeme

Autor/Redakteur: Holger Temme, Regional Director, EMEA bei Neo Technology/gg

Neo4j_Holger_Temme

Masterdatamanagement – kurz MDM – sorgt nicht nur für mehr Durchblick im Datenchaos. In Verbindung mit Graph-Technologie eröffnet es sogar einen 360 Grad -Blick auf die Stammdaten. Datengetriebene Unternehmen, die mit dem MDM Ernst machen, nutzen Graphdatenbanken, um neue Fragen zu stellen und innerhalb des immer komplexer werdenden Datennetzwerks neue Antworten zu entdecken. Denn anders als bei herkömmlichen Datenbanken geht es bei den Graphen vor allem um eins: Beziehungen.

Erreicht ein Unternehmen nach der ersten Wachstumsphase eine bestimmte Größe, rückt das MDM mehr und mehr in den Fokus. Viele der Aufgaben, die es löst, fallen erst dann an, wenn mehrere Systeme parallel zueinander arbeiten und die Notwendigkeit an gepflegten und validen Stammdaten wächst. Unternehmen investieren entsprechend in MDM-Systeme mit dem Ziel mehr Effizienz in den Geschäftsprozessen zu erreichen, Risiken besser zu bewerten und Compliance-Anforderungen nachkommen zu können.

Das Einmaleins des MDM

In der Theorie ist MDM simpel. Egal mit wie vielen Systemen ein Unternehmen arbeitet, die Stammdaten eines Kunden müssen überall konsistent sein. Kauft ein Kunde über einen neuen Kanal ein, muss dieser mit dem Stammdatensatz verknüpft sein. Ändert ein Kunde seine Telefonnummer oder Email, muss das in allen Datensätzen eingepflegt werden. Greift ein System auf eine Kundeninfo von einem anderen System zu, muss das schnell und einfach gehen.

In der Praxis wird dazu ein Repository erstellt, in dem wichtige Daten gesammelt werden und das damit zur einer der Hauptinformationsquellen des Unternehmens wird. Dazu gehören Daten von Kunden, Produkten, Buchhaltung, Mitarbeitern, Lieferanten, Partnern und andere gemeinsam nutzbare Daten innerhalb eines Unternehmens. Auch Referenzdaten werden in die Stammdaten miteinbezogen. Ausgeführt als XLM- oder relationale Datenbank entwickelt sich das Repository zu einem leistungsstarken Instrument für die Datenintegration.

Und wo liegt das Problem?

Unternehmen, die MDM ausschließlich als ein mit allen Systemen synchronisiertes Repository auffassen, verpassen es, weitere wertvolle Informationen aus ihren Stammdaten zu schöpfen. Denn der Mehrwert der Daten liegt nicht allein in ihrer Verfügbarkeit über alle Systeme hinweg, sondern auch in ihren Beziehungen zueinander. In relationalen Datenbanken bestehen diese Beziehungen aus Fremdschlüsselverbindungen der Primärtabellen, mit deren Hilfe sich Datenreihen miteinander verknüpfen lassen.

Tatsächlicher Mehrwert zeigt sich jedoch erst bei komplexen und vielschichtigen Fragen. Welche Produkte werden üblicherweise zusammen erworben? Kaufen Mitglieder des gleichen Haushalts die gleichen Produkte? Wo bieten sich Produktbündel an? Was gibt letztendlich den Ausschlag zum Kauf? Natürlich lassen sich solche komplexen Suchanfragen auch mit relationalen Modellen beantworten. Allerdings kosten die entsprechenden Berechnungen mit herkömmlichen Systemen sehr viel Zeit und Nerven.

Stark vernetzte und unstrukturierte Informationen, zum Beispiel entlang einer Customer Journey, können auf Grund der Struktur des Graphen natürlich abgebildet werden
Stark vernetzte und unstrukturierte Informationen, zum Beispiel entlang einer Customer Journey, können auf Grund der Struktur des Graphen natürlich abgebildet werden

Graphdatenbanken können hier ihre Stärken voll ausspielen und den Wert eines MDM grundlegend verändern. Sie lassen starre Tabellenstrukturen hinter sich und konzentrieren sich auf die Beziehungen der Daten untereinander. Stark vernetzte und unstrukturierte Informationen werden anschaulich dargestellt, aufwendige Berechnungen zwischen den Elementen entfallen. Die Geschwindigkeit hängt nicht mehr von der Gesamtmenge der Daten und der Verknüpfungsoperationen ab, sondern allein von der Anzahl der konkreten, für die Abfrage relevanten Beziehungen. Das spart Zeit und bringt eine hohe Performance, die Antworten innerhalb von Millisekunden liefern kann.

Unternehmen treffen keine Entscheidungen auf Grundlage von Datensilos. Der Datensatz KUNDE und der Datensatz PRODUKT allein verrät wenig über deren Wechselbeziehung. Spannend wird es für die Analytiker erst, wenn alle Verbindungen zwischen diesen beiden Datensätzen sichtbar werden.