cloud, cloudpannen, amazon, google, microsoft, blackberry, hosting-anbieter, backup

Das Thema Cloud-Computing war 2011 in aller Munde. Die CeBIT setzte sogar den Schwerpunkt darauf. Doch in all der Euphorie gab es 2011 auch einige Ausfälle zu verzeichnen. Hier kommen die fünf größten Cloud-Pannen des vergangenen Jahres.

1) April 2011 – Datenverlust bei Amazon EC2

Im EC2-Rechenzentrum in Virginia entstand im April 2011 aufgrund eines Routingfehlers im Rahmen eines Netzwerkupgrades für Amazons Elastic Block Store ein Ausfall mehrerer Datenbankinstanzen. Die Folge war nicht nur eine Ausfallzeit von mehreren Stunden, sondern auch eine unbekannte Anzahl an Daten sind dabei unwiederbringlich verloren gegangen. Viele große und kleine Internetdienste wie zum Beispiel Foursquare (foursquare.com), Quora (www.quora.com) und Reddit (www.reddit.com) fielen dabei aus.

2) Juli 2011 – Googles App Engine mit Problemen

Googles Cloud-Plattform App Engine war Mitte Juli für mehrere Stunden nicht erreichbar. Die Plattform, die zum Entwickeln und Hosten von in Java, Python oder Go programmierten Webanwendungen genutzt wird, zeigte Probleme bei der Versorgung von Java-Programmen und Verzögerungen beim Zugriff. Nach kurzer Wartungszeit konnte der PaaS-Dienst wieder ohne Probleme ausgeführt werden.

3) August 2011 – Amazon EC2 vom Netz

Im August 2011 führte ein Blitzeinschlag zum Stromausfall des Rechenzentrums in Dublin, in dem die Amazon EC2-Infrastruktur gehostet wird. Der Blitz schlug dabei in einen Transformator ein, wodurch selbst die Rechenzentrums-eigenen Generatoren nicht gestartet werden konnten. Somit ging das Rechenzentrum kurzzeitig vom Netz. Amazon sprach von zwei Stunden Ausfallzeit. Bei einigen der beeinträchtigten Instanzen dauerte die Wiederherstellung jedoch länger.

4) August 2011 – Microsoft BPOS-Dienst offline

Der Blitzschlag im Rechenzentrum in Dublin hatte auch für Microsoft Folgen. Betroffen war der Microsoft BPOS-Dienst. Die Microsoft-Kunden waren damit ebenfalls mehrere Stunden offline. Der reibungslose Betrieb wurde erst nach 48 Stunden wieder hergestellt. Wenige Tage später teilte Microsoft jedoch mit, seinen Kunden für den Ausfall zu entschädigen und ein Viertel der Rechnungssumme gutzuschreiben.

5) Oktober 2011 – Blackberry-Ausfall

Weil es im Oktober 2011 zu einem Ausfall eines Core Switchs kam, war der Zugriff auf den E-Mail-Service, die Internetnutzung und der Messenger-Dienst von Blackberry-Nutzern für mehrere Stunden in den Regionen Europa, Naher Osten und Afrika unterbrochen. Der defekte Switch konnte relativ schnell ausgewechselt werden, aber aufgrund des Datenrückstaus belief sich die Ausfallzeit auf mehrere Tage.

Fazit: Sicherheit geht vor

Eine 100-prozentige Ausfallsicherheit kann von keinem Hosting-Anbieter, egal ob Cloud oder nicht Cloud, gewährleistet werden. Wem das bewusst ist, kann sich jedoch in gewissem Maße schützen. Eine redundante Infrastrukturauslegung, eventuelle Backups in einem zweiten Rechenzentrum und gegebenenfalls eine Offline-Zugriffslösung sind nur einige Sicherungsmaßnahmen. Bei der Anbieterauswahl sollte zudem darauf geachtet werden, ob es im Falle eines Ausfalls oder einer Störung eine Disaster-Recovery-Strategie gibt. Hilfreich ist auch zu wissen, inwieweit die Kunden in die Kommunikation mit einbezogen werden und ob es im Falle eines Ausfalls zu Entschädigungen kommt.

Bild: Margot Kessler  / pixelio.de