Rechenzentren: Think big
Autor/Redakteur: Rob Ober, LSI Fellow Corporate Strategy/gg

Nur wenige Menschen dürfen sie betreten, aber jeder Internetnutzer greift täglich auf sie zu: Mega-Rechenzentren. Betreiber wie Facebook, Google oder United Internet bieten über sie unzählige internet-basierte Dienste an. Amazon und viele Wettbewerber ermöglichen Unternehmen über diese riesigen Rechenzentren, die Vorteile von Cloud Computing zu nutzen. Mega Datacenter (MDC) machen inzwischen 25 Prozent des weltweiten Servermarkts aus und sind zu einer treibenden Kraft für IT-Innovationen geworden, da sie mit der explosionsartigen Datenzunahme Schritt halten und sich rapide weiterentwickeln müssen.
Unternehmen orientieren sich daher an MDC und wollen MDC-Architekturen für ihre eigenen privaten Clouds, Computing-Cluster und Analyseanwendungen für Big Data nachahmen. Denn MDC setzen die Maßstäbe hinsichtlich Leistung, Kosteneffizienz, skalierbaren Implementierungen und Umsatzgenerierung aus Daten.
Anatomie eines MDC
Ein Teil des Geheimnisses ist, dass die Anatomie eines MDC weniger komplex ist, als man annehmen könnte. Große Betreiber verwenden nur eine Handvoll unterschiedlicher Plattformen, die für unterschiedliche Aufgaben optimiert sind, wie Speicherung, Datenbanken, Analysen/Suche/Graphenanalysen oder Webserver. Die Größe der Rechenzentren ist kaum noch vorstellbar – MDC umfassen im Allgemeinen 200.000 bis 1.000.000 Server und 1,5 bis 10 Millionen Laufwerke.
MDC-Server werden im Allgemeinen in großen Clustern von 20 bis 2.000 Serverknoten verwaltet. Abhängig von seiner speziellen Aufgabe enthält ein Server zum Beispiel nur Bootspeicher, nur direkt zugeordnete Laufwerke oder nur durch RAID replizierten Speicher für Datenbank- und Transaktionsdaten. Anwendungen führen die Rechenzentren auf dem Cluster aus. Das heißt auch: Ein fehlerhafter Knoten kann die Leistung des gesamten Clusters beeinträchtigen. Wenn ein Server Probleme bereitet, ist es oft der effektivste Weg, ihn vorläufig ganz abzuschalten, damit die übrigen 99 Prozent bei voller Geschwindigkeit arbeiten können.

MDC-Betriebssysteme und -Infrastrukturen sind Open-Source-Lösungen – und die meisten Weiterentwicklungen an MDC werden wieder der Community zur Verfügung gestellt. Die Betreiber stellen ihre Hardware oft selbst zusammen oder spezifizieren sie zumindest selbst. Da es sich bei MDC-Netzwerken im allgemeinen um statische Konfigurationen handelt, bei denen die Minimierung der Transaktionslatenz im Vordergrund steht, verwenden MDC-Architekten SDN-Infrastrukturen (Software Defined Network), um die Leistung zu verbessern und die Kosten zu senken.
Da MDC so riesig sind, benötigen sie eine “Lights-Out-Infrastruktur”. Das heißt, die Administratoren haben nur vergleichsweise einfache manuelle Wartungsaufgaben. Ansonsten hält die Infrastruktur mithilfe von automatisierten Skripts selbst ihren Betrieb aufrecht. Betreiber von MDC minimieren ihre Infrastrukturkosten so weit wie nur möglich. Dies führt dazu, dass MDC-Architekten alles eliminieren, was nicht für die zentralen Anwendungen benötigt wird, selbst wenn es kostenlos bereitgestellt wird. Ein Rechenbeispiel: Wenn 200.000 Server je eine überflüssige LED aufweisen, sind dies 10.000 US-Dollar unnötige Kosten für die LEDs und 26.000 Watt Energieverbrauch im Jahr. Das entspricht 26 Föhns oder Wasserkochern, die rund um die Uhr laufen.