{"id":16242,"date":"2020-06-09T11:44:00","date_gmt":"2020-06-09T09:44:00","guid":{"rendered":"https:\/\/www.sysbus.eu\/?p=16242"},"modified":"2020-06-03T10:52:17","modified_gmt":"2020-06-03T08:52:17","slug":"tapes-als-objektspeicher-fuer-grosse-datenmengen-nahtlos-integrieren","status":"publish","type":"post","link":"https:\/\/www.sysbus.eu\/?p=16242","title":{"rendered":"Tapes als Objektspeicher f\u00fcr gro\u00dfe Datenmengen nahtlos integrieren"},"content":{"rendered":"\n<p>Autor\/Redakteur: <a href=\"https:\/\/www.point.de\/startseite\/\">Sebastian Klee, Manager Sales &amp; Marketing der PoINT Software &amp; Systems GmbH<\/a>\/gg<\/p>\n\n\n\n<p>Ein wesentliches und immer dr\u00e4ngenderes Problem ist das Wachstum inaktiver unstrukturierter Daten, das Unternehmen durch die Integration von Tape-basierten Objektspeichersystemen l\u00f6sen k\u00f6nnen. Dabei handelt es sich um einen Ansatz, der viele Vorteile hinsichtlich Kosten, Datensicherheit und Skalierbarkeit mit sich bringt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-1024x956.jpg\" alt=\"\" class=\"wp-image-16243\" width=\"1024\" height=\"956\" srcset=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-1024x956.jpg 1024w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-300x280.jpg 300w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-768x717.jpg 768w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-1536x1434.jpg 1536w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Dashboard-2048x1912.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Screenshot: PoINT Software &amp; Systems<\/figcaption><\/figure>\n\n\n\n<!--more-->\n\n\n\n<p>Das World Economic Forum geht davon aus, dass die weltweite Menge an Daten bald 40 Zettabytes \u00fcberschreiten wird. Im Jahr 2013 waren es nur 4,4 Zettabytes. Bei dieser steigenden Datenmenge sind kosteng\u00fcnstige Speicher gefragt. Dazu geh\u00f6ren grunds\u00e4tzlich Objektspeicher, die viele gro\u00dfe Festplatten in einer hohen Dichte einsetzen. Es ist nicht un\u00fcblich, dass pro Knoten 50 bis 70 Festplatten verbaut sind, die jeweils \u00fcber eine Kapazit\u00e4t von acht bis zw\u00f6lf TB verf\u00fcgen. Im Sommer 2019 stellte Cloudian eine gemeinsame Plattform mit Seagate vor, die sogar 96 mal 16 TB Festplatten umfasst. Dies entspricht 1,5 PB auf lediglich vier H\u00f6heneinheiten.<\/p>\n\n\n\n<p>Allerdings sind festplattenbasierte Objektspeicher und auch Cloud-Dienste bei sehr hohen Datenmengen teuer, so dass sich die Frage stellt, welches Speichermedium sich im Rahmen von Storage Tiering und Archivierung f\u00fcr sehr gro\u00dfe Mengen inaktiver Daten eignet. Die Antwort ist schnell gefunden: Es sind Tapes, und zwar aus wirtschaftlichen und auch aus technologischen Gr\u00fcnden. Auf einem LTO-8-Medium lassen sich beispielsweise unkomprimiert zw\u00f6lf TB unterbringen, sodass sich die Kosten auf nur 0,01 Euro pro GB belaufen. Hinzu kommt, dass Tape-Libraries einfach in Speicherinfrastrukturen eingebunden werden k\u00f6nnen, wenn der Zugriff mit einer entsprechenden Software-Schicht \u00fcber eine S3-Schnittstelle bereitgestellt wird. Das S3-Protokoll (Simple Storage Service) wurde von Amazon bereits 2006 eingef\u00fchrt. Seitdem hat es sich als Industriestandard etabliert, der von immer mehr Applikationen unterst\u00fctzt wird. Mit dem zugrunde liegenden HTTP-Protokoll lassen sich die besonderen Eigenschaften von Tapes ber\u00fccksichtigen. Denn sowohl Tapes als auch HTTP haben einen sequenziellen Charakter, sodass lange Latenzen und auch hohe Zugriffszeiten abgebildet werden k\u00f6nnen. Auch das Setzen von hohen Time-Out-Zeiten ist m\u00f6glich. Au\u00dferdem hat das HTTP-Protokoll wesentlich weniger Einschr\u00e4nkungen als File-basierte Protokolle, was zum Beispiel die Anzahl von Dateien beziehungsweise deren Zeichens\u00e4tze oder Namensl\u00e4nge betrifft.<\/p>\n\n\n\n<!--nextpage-->\n\n\n\n<p><strong>Wie sieht eine skalierbare Architektur f\u00fcr die Einbindung von Tapes aus?<\/strong><\/p>\n\n\n\n<p>Das skalierbare Design enth\u00e4lt zwei Arten von Knoten, und zwar Interface- und Database-Knoten, die unterschiedliche Aufgaben haben. Die Interface-Knoten bilden den S3-HTTP-Service f\u00fcr die Schnittstelle, um Clients anzubinden. Sie sind f\u00fcr den Datenstrom notwendig, f\u00fchren das Erasure-Coding beziehungsweise eventuelle Verschl\u00fcsselungen durch und schreiben die Daten anschlie\u00dfend auf die Tape-Laufwerke. Dabei kann jeder dieser Knoten bis zu acht Tape-Laufwerke ansteuern. Sind mehr im Einsatz, muss folglich die Zahl der Interface-Knoten erh\u00f6ht werden.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"597\" src=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-1024x597.jpg\" alt=\"\" class=\"wp-image-16245\" srcset=\"https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-1024x597.jpg 1024w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-300x175.jpg 300w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-768x448.jpg 768w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-1536x896.jpg 1536w, https:\/\/www.sysbus.eu\/wp-content\/uploads\/2020\/06\/PoINT-Archival-Gateway-Database-Nodes-System-Components-2048x1195.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Grafik: PoINT Software &amp; Systems<\/figcaption><\/figure>\n\n\n\n<p>Die Koordination \u00fcbernehmen die Database-Knoten, die redundant auslegbar sind. Sie verwalten das ganze System, steuern die Robotic und kommunizieren daf\u00fcr mit den Interface-Knoten.<\/p>\n\n\n\n<p><strong>Anwendungsf\u00e4lle f\u00fcr eine Tape-basierte S3-Object-Storage-Architektur<\/strong><\/p>\n\n\n\n<p>Forschungs- und Messdaten sind ein wertvoller Rohstoff, der sicher und umsichtig langzeitarchiviert werden sollte. So steht in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG), dass \u201edie langfristige Sicherung und Bereitstellung der Forschungsdaten einen Beitrag zur Nachvollziehbarkeit und Qualit\u00e4t der wissenschaftlichen Arbeit leistet und wichtige Anschlussm\u00f6glichkeiten f\u00fcr die weitere Forschung er\u00f6ffnet\u201c. Ziel ist eine langfristige Sicherung der Daten, die bis zu zehn Jahre archiviert werden sollten. Folglich sind Speichersysteme gefragt, die die immensen Mengen von Forschungs- und Mess-, aber auch gro\u00dfen Multimediadaten sicher und m\u00f6glichst kosteneffizient archivieren. Daf\u00fcr eignen sich vor allem Tape-basierte S3-Objektspeicher.<\/p>\n\n\n\n<p>Ein weiterer klassischer Anwendungsfall ist die Entlastung von festplattenbasierten On-Premise-Object-Storage-Systemen, die bereits viele Unternehmen im Einsatz haben. Auf solche Systeme gelangen immer mehr Daten, die sukzessiv veralten und bei denen ein direkter Zugriff nicht mehr erforderlich ist. \u00dcber ein entsprechendes Tiering oder ILM-Funktionen lassen sich diese \u201ekalten\u201c Daten regelbasiert \u00fcber eine S3-Schnittstelle auf Tapes auslagern.<\/p>\n\n\n\n<p>F\u00fcr das Backup beziehungsweise die Replikation produktiver Cloud-Daten eignen sich ebenfalls S3-Object-Storage-Architekturen hervorragend. H\u00e4ufig untersch\u00e4tzen Unternehmen das Risiko, Daten in der Cloud abzulegen, weil sie die Meinung vertreten, dass diese dort sicher sind. Die Hochverf\u00fcgbarkeit von Cloud-Systemen ist zwar grunds\u00e4tzlich gegeben, aber was passiert, wenn ein Rechenzentrum von Viren oder Ransomware und somit s\u00e4mtliche gehosteten Clouds befallen werden? Die eigenen Daten bei einem zweiten Cloud-Provider oder auf Festplatten zu sichern, ist zu teuer. Dagegen fallen die Kosten f\u00fcr die Erstellung eines Replikats auf Tape wesentlich g\u00fcnstiger aus. Wenn das Cloud-System \u00fcber eine S3-Schnittstelle verf\u00fcgt, dann kann das Unternehmen bei Ausfall des Cloud-Providers mit S3 direkt auf seine Daten zugreifen und so unmittelbar weiterarbeiten. Sobald das System wieder lauff\u00e4hig ist, l\u00e4sst sich der Restore im Hintergrund durchf\u00fchren. So l\u00e4sst sich auch ohne Weiteres eine 3-2-1-Backup-Strategie umsetzen.<\/p>\n\n\n\n<!--nextpage-->\n\n\n\n<p><strong>Wie gelangen Objekte auf Tape?<\/strong><\/p>\n\n\n\n<p>Die oben beschriebenen Argumente machen deutlich, dass Unternehmen mit Tapes die Herausforderungen des Datenwachstums meistern k\u00f6nnen. Die Frage, die sich dann noch stellt, ist, wie die Daten auf die Tapes gelangen? Da Objektspeicher keine direkte Anbindung f\u00fcr Tape-Libraries bieten, k\u00f6nnte man auf die Idee kommen, mittels Softwaretools die Objekte zun\u00e4chst in ein File-System zu kopieren und von dort aus auf Tape zu verlagern. Hier ist Vorsicht geboten, denn es droht aufgrund der begrenzten Zeichens\u00e4tze, Pfadl\u00e4nge, Versionierung und so weiter ein Informationsverlust. Au\u00dferdem greifen dann weitere Einschr\u00e4nkungen eines Dateisystems, zum Beispiel in Bezug auf die Anzahl unterst\u00fctzter Objekte.<\/p>\n\n\n\n<p>Eine bessere Alternative besteht darin, eine Software-L\u00f6sung zu implementieren, die eine hohe Performance und Datenverf\u00fcgbarkeit sicherstellt, indem sie Daten \u00fcber eine S3 Schnittstelle empf\u00e4ngt und diese dann direkt auf Tapes schreibt.<\/p>\n\n\n\n<p>Eine solche L\u00f6sung sollte folgende Anforderungen erf\u00fcllen:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Standardisierte S3-REST-Schnittstelle<\/li><li>Hohe Skalierbarkeit<\/li><li>Hohe Verf\u00fcgbarkeit durch Redundanz von Server-Knoten<\/li><li>Unterst\u00fctzung tausender paralleler Client-Verbindungen, um einen hohen Datendurchsatz zu gew\u00e4hrleisten<\/li><li>Integriertes \u201eErasure Coding\u201c, welches Datenbl\u00f6cke redundant auf mehreren Medien speichert, sodass die Datensicherheit gew\u00e4hrleistet ist.<\/li><li>\u00dcbersichtliche Administrationsoberfl\u00e4che, die eine intuitive Konfiguration erm\u00f6glicht<\/li><\/ul>\n\n\n\n<p><strong>Fazit<\/strong><\/p>\n\n\n\n<p>Tapes erleben aufgrund des rasanten Datenwachstums eine Renaissance. In Kombination mit Software-L\u00f6sungen, die ihre technologischen Besonderheiten ber\u00fccksichtigen, sind Unternehmen in der Lage, hohe Datenmengen sicher und gleichzeitig kosteng\u00fcnstig zu archivieren. Die Nutzung der standardisierten S3-Schnittstelle ist dabei der Weg der Wahl.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ein wesentliches und immer dr\u00e4ngenderes Problem ist das Wachstum inaktiver unstrukturierter Daten, das Unternehmen durch die Integration von Tape-basierten Objektspeichersystemen l\u00f6sen k\u00f6nnen. Dabei handelt es sich um einen Ansatz, der viele Vorteile hinsichtlich Kosten, Datensicherheit und Skalierbarkeit mit sich bringt.<\/p>\n","protected":false},"author":3,"featured_media":16243,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"colormag_page_container_layout":"default_layout","colormag_page_sidebar_layout":"default_layout","footnotes":""},"categories":[8,17],"tags":[6257,896,12808,5346,61,1353],"class_list":["post-16242","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-artikel","category-storage","tag-cloud","tag-festplatte","tag-point-software","tag-s3","tag-speicher","tag-tape"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/16242","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=16242"}],"version-history":[{"count":1,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/16242\/revisions"}],"predecessor-version":[{"id":16247,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/posts\/16242\/revisions\/16247"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=\/wp\/v2\/media\/16243"}],"wp:attachment":[{"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=16242"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=16242"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sysbus.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=16242"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}