{"id":21096,"date":"2022-05-16T11:11:00","date_gmt":"2022-05-16T09:11:00","guid":{"rendered":"https:\/\/www.sysbus.eu\/?p=21096"},"modified":"2022-05-09T10:23:56","modified_gmt":"2022-05-09T08:23:56","slug":"dezentral-statt-zentral-warum-data-mesh-etablierte-data-repositories-abloesen-wird","status":"publish","type":"post","link":"https:\/\/www.sysbus.eu\/?p=21096","title":{"rendered":"Dezentral statt zentral: Warum Data Mesh etablierte Data Repositories abl\u00f6sen wird"},"content":{"rendered":"\n<p>Autorin\/Redakteur: <a href=\"https:\/\/www.endava.com\/\">Adriana Calomfirescu, Group Head of Data Delivery bei Endava<\/a>\/gg<\/p>\n\n\n\n<p>Mit Data Mesh scheint sich bei der Datenspeicherung und -verarbeitung ein Paradigmenwechsel anzubahnen. Statt zentraler Data Repositories, wie Data Warehouses oder Data Lakes, k\u00f6nnten Unternehmen in Zukunft auf eine verteilte Datenarchitektur setzen, um endlich das volle Potenzial ihrer Daten aussch\u00f6pfen zu k\u00f6nnen. Dieser Artikel erkl\u00e4rt die Grunds\u00e4tze dieses neuen Datenarchitekturkonzepts, welche Vorteile es bietet und was bei der Entscheidung, ob es zu einem Unternehmen passt, zu beachten ist.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><a href=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-scaled.jpg\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-683x1024.jpg\" alt=\"\" class=\"wp-image-21098\" width=\"683\" height=\"1024\" srcset=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-683x1024.jpg 683w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-200x300.jpg 200w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-768x1151.jpg 768w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-1025x1536.jpg 1025w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-1366x2048.jpg 1366w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-1320x1979.jpg 1320w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2022\/05\/2203-Endava-Adriana-Calomfirescu-scaled.jpg 1708w\" sizes=\"auto, (max-width: 683px) 100vw, 683px\" \/><\/a><figcaption>Bild: Endava<\/figcaption><\/figure>\n\n\n\n<!--more-->\n\n\n\n<p>\u201eDaten sind das neue \u00d6l\u201c \u2013 dieses Zitat des britischen Mathematikers Clive Humby ist mittlerweile \u00fcber 15 Jahre alt und die meisten Unternehmen haben seitdem die Bedeutung seiner Worte durchaus erkannt: Sie versuchen, das Potenzial ihrer Daten zu nutzen. Daf\u00fcr sammeln sie immer gr\u00f6\u00dfere Datenbest\u00e4nde in zentralen Datenspeichern, die dort bereinigt und aufbereitet werden, damit sie im Anschluss als qualitativ hochwertige Daten weiterverarbeitet werden k\u00f6nnen.<\/p>\n\n\n\n<p>Die Daten stammen dabei aus internen operativen und transaktionalen Systemen und Dom\u00e4nen, die f\u00fcr den Gesch\u00e4ftsbetrieb essenziell sind. Aber auch Daten aus externen Quellen, die Unternehmen zus\u00e4tzliche Informationen bieten, werden in das Data Warehouse oder den Data Lake eingespeist.<\/p>\n\n\n\n<p><strong>Die Datenmengen werden f\u00fcr Data Repositories zum Problem<\/strong><\/p>\n\n\n\n<p>Unternehmen sto\u00dfen bei dieser monolithischen Datenplattform-Architektur jedoch langsam an Grenzen \u2013 und erreichen oft gar nicht erst die gew\u00fcnschten Ergebnisse. Sie stehen vor der Herausforderung, ihre immer gr\u00f6\u00dfer werdenden Datenmengen zu kontrollieren und harmonisieren, um ihr volles Potenzial zu entfalten. Zudem kostet dieser Prozess Zeit und Geld. Daher ist ihre F\u00e4higkeit eingeschr\u00e4nkt, flexibel und schnell auf die steigende Anzahl an internen und externen Datenquellen zu reagieren und diese mit ihren Daten zu verbinden.<\/p>\n\n\n\n<p>Dar\u00fcber hinaus l\u00e4sst sich die Herkunft von Daten in diesen Speichern oft nicht vollst\u00e4ndig nachvollziehen, also beispielsweise: Aus welchem System stammen sie urspr\u00fcnglich? Durch welche weiteren Systeme sind sie gewandert? Wann wurden sie wie ver\u00e4ndert und von wem? Diese Informationen sind wichtig, um eine hohe Qualit\u00e4t der Daten sicherstellen zu k\u00f6nnen. Jedoch werden sie aufgrund der gro\u00dfen Datenmengen, die im Repository landen \u2013 als auch aufgrund der Geschwindigkeit, mit der sich die Daten ver\u00e4ndern \u2013 manchmal vernachl\u00e4ssigt und nicht vollst\u00e4ndig nachverfolgt und verzeichnet. Dies f\u00fchrt in der Regel dazu, dass kleine und mittelst\u00e4ndische Unternehmen (KMUs), die mit den Daten arbeiten sollen, diese nur z\u00f6gerlich nutzen.<\/p>\n\n\n\n<p>Infolgedessen f\u00e4llt es Unternehmen schwer, aus ihren Daten aussagekr\u00e4ftige Insights zu generieren und neue Use Cases \u2013 etwa neue Produkte oder Services f\u00fcr ihre Kunden \u2013 zu identifizieren. Zudem braucht es Zeit, die Daten zu transformieren und f\u00fcr Kunden aufzubereiten. Das ist vor allem dann der Fall, wenn ein Unternehmen nicht gen\u00fcgend Data Scientists oder Engineers besch\u00e4ftigt, die genau wissen, wie die Daten verarbeitet werden m\u00fcssen, um ihren Zweck zu erf\u00fcllen. W\u00e4hrend eines <a href=\"https:\/\/www.bitkom.org\/Presse\/Presseinformation\/IT-Fachkraefteluecke-wird-groesser\">akuten IT-Fachkr\u00e4ftemangels<\/a> ist das leider nicht unwahrscheinlich.<\/p>\n\n\n\n<p><strong>Mehr aus den Daten herausholen<\/strong><\/p>\n\n\n\n<p>Mit dem Data-Mesh-Konzept wird versucht, sich diesen Herausforderungen zu stellen, indem Daten als Produkt verwaltet werden. Dabei werden die Daten nicht l\u00e4nger in einem zentralen Data Repository zusammengef\u00fchrt, sondern als Data Domains strukturiert, mit Data Owners versehen und ordnungsgem\u00e4\u00df katalogisiert, damit jeder im Unternehmen einfach auf die Metadaten zugreifen kann. Das Team gilt als Data Owner und muss seine Daten so aufbereiten, dass andere Datenkonsumenten im Unternehmen mit den Datenprodukten zufrieden sind und sie problemlos \u00fcber Self-Service-Optionen verwenden k\u00f6nnen. Um dies zu erreichen, m\u00fcssen sie bei der Erstellung und Verwaltung ihrer Datenprodukte eine Reihe von Grunds\u00e4tzen erf\u00fcllen, zum Beispiel Datenintegrit\u00e4t, Auffindbarkeit, Selbstbeschreibung und Interoperabilit\u00e4t. Dies steigert das Vertrauen der Konsumenten in die Produkte.<\/p>\n\n\n\n<!--nextpage-->\n\n\n\n<p>Damit sind die Verantwortlichkeiten klar definiert, was sicherstellt, dass die Mitarbeiter ihre Daten und deren Qualit\u00e4t nicht nur als Nebens\u00e4chlichkeit betrachten, sondern als spezifische und vor allem wichtige Aufgabe, um die sie sich k\u00fcmmern m\u00fcssen. Der gr\u00f6\u00dfte Vorteil dabei: Die datenproduzierenden Abteilungen kennen ihre Daten nat\u00fcrlich am besten. Entsprechend f\u00e4llt es ihnen leichter, neuen Nutzen aus ihnen zu ziehen und neue Anwendungsm\u00f6glichkeiten zu entwickeln.<\/p>\n\n\n\n<p>In dieser neuen Datenarchitektur ver\u00e4ndert sich auch die Rolle der Data Scientists und Engineers: Sie sind nicht l\u00e4nger als Mittelsm\u00e4nner zwischen den datenproduzierenden und datenkonsumierenden Teams t\u00e4tig, sondern werden selbst Teil von ersterem. Dadurch erlernen sie das notwendige Dom\u00e4nenwissen, um ihre neuen Teamkollegen bestm\u00f6glich bei der Aufbereitung der Datenprodukte zu unterst\u00fctzen. Dies vereinfacht und beschleunigt den gesamten Prozess, was gleichzeitig zu geringeren Gesamtkosten f\u00fchrt.<\/p>\n\n\n\n<p><strong>Zentrale Standards und ein zentrales Register<\/strong><\/p>\n\n\n\n<p>Der Data-Mesh-Ansatz eignet sich vor allem f\u00fcr gr\u00f6\u00dfere Unternehmen, die mit sehr gro\u00dfen Datenbest\u00e4nden und einer Vielzahl von Datenquellen arbeiten. Kleinere Firmen kommen dagegen in der Regel auch weiterhin mit einem zentralen Datenspeicher aus. Bei der Umsetzung sollten Unternehmen zwei Punkte ber\u00fccksichtigen, um die notwendigen Prozesse einzurichten:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Ein zentrales Data-Governance-Modell<\/strong>: Data Mesh funktioniert nur, wenn alle Datenprodukte innerhalb eines Unternehmens einheitliche Standards und Richtlinien einhalten. Nur so sind sie interoperabel und Datenkonsumenten k\u00f6nnen mehrere Datenprodukte zusammenf\u00fchren und entsprechend ihrer Anforderungen mit ihnen arbeiten. Daher m\u00fcssen Unternehmen zun\u00e4chst Standards und Richtlinien definieren, die festlegen, wie Datenprodukte kategorisiert, verwaltet und abgerufen werden.<\/li><\/ul>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Ein zentraler Datenkatalog<\/strong>: Damit Datenkonsumenten in der Lage sind, Datenprodukte zu finden, brauchen Unternehmen einen zentralen Datenkatalog. In diesem werden alle existierenden Datenprodukte verzeichnet, einschlie\u00dflich zus\u00e4tzlicher Informationen wie der Datenherkunft. Zudem k\u00f6nnen die Data Owner auch Beispieldatens\u00e4tze erg\u00e4nzen, mithilfe derer die Datenkonsumenten das Produkt ausprobieren k\u00f6nnen, bevor sie eigene Datens\u00e4tze verwenden.<\/li><\/ul>\n\n\n\n<p><strong>Fazit: Der Paradigmenwechsel steht bevor und nur wenige sind bereit, diese unvermeidliche Marktver\u00e4nderung zu nutzen<\/strong><\/p>\n\n\n\n<p>Data Mesh ist ein neuer, dezentraler Ansatz f\u00fcr die Speicherung und Verarbeitung von Daten, der noch keine breite Anwendung gefunden hat. Aber je mehr Unternehmen feststellen, dass Data Repositories, die sich in den letzten Jahren etabliert haben, f\u00fcr ihre Anforderungen nicht mehr ausreichen, desto mehr werden sich nach Alternativen umsehen. Data Mesh bietet ihnen dabei die M\u00f6glichkeit, mehr aus ihren vorhandenen Daten herauszuholen und gleichzeitig Mitarbeiter effizienter einzusetzen sowie interne Prozesse effektiver und flexibler zu gestalten.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mit Data Mesh scheint sich bei der Datenspeicherung und -verarbeitung ein Paradigmenwechsel anzubahnen. Statt zentraler Data Repositories, wie Data Warehouses oder Data Lakes, k\u00f6nnten Unternehmen in Zukunft auf eine verteilte Datenarchitektur setzen, um endlich das volle Potenzial ihrer Daten aussch\u00f6pfen zu k\u00f6nnen. Dieser Artikel erkl\u00e4rt die Grunds\u00e4tze dieses neuen Datenarchitekturkonzepts, welche Vorteile es bietet und was bei der Entscheidung, ob es zu einem Unternehmen passt, zu beachten ist.<\/p>\n","protected":false},"author":1,"featured_media":21098,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"colormag_page_container_layout":"default_layout","colormag_page_sidebar_layout":"default_layout","footnotes":""},"categories":[8,750],"tags":[10256,16435,16436,9819,16434],"class_list":["post-21096","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-artikel","category-big-data","tag-data-lake","tag-data-mesh","tag-data-repository","tag-data-warehouse","tag-endava"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/21096","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=21096"}],"version-history":[{"count":1,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/21096\/revisions"}],"predecessor-version":[{"id":21099,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/21096\/revisions\/21099"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/media\/21098"}],"wp:attachment":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=21096"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=21096"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=21096"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}