crash ... und so hat es die THM in der Nacht vom Montag auf Dienstag erwischt: kompletter Stromausfall.






und leider nicht nur das: praktisch alle zentralen technischen Systeme sind - zumindest teilweise - ausgefallen: von der zentralen elektrischen Schließung, über zentrale Serversysteme bis hin zum WLAN-Netz.
Am unangenehmsten: über Tage konnten weder emails gesendet noch empfangen werden.
(BITTE SENDEN SIE DRINGENDE EMAIL IM ZWEIFEL NOCHMALS)

Als nach unendlichen Stunden (ca. 8) die Stromversorgung wieder anlief, versagten viele Rechnersysteme beim Wiederanlauf bzw. mussten am Mittwoch nochmals hart hochgefahren werden. Als kritisch stellte sich die Umstellung vieler zentraler Services auf virtuelle Maschinen heraus.

 

Dabei erwies sich die (virtuelle) MNI-Infrastruktur als recht robust:
Die MNI-Seite war sofort nach dem Stromausfall verfübar und blieb es auch. Selbst das zentrale Login über den CAS-Server lief und fiel, als der CAS-Server abgeschaltet werden musste auf die gute alte LDAP-Verbindung zurück. Erst als auch diese abgeschaltet wurde, konnte man sich auf der Seite nur noch als (eingetragener) lokaler Benutzer anmelden.
Die THM-Hauptseite war allerdings auch noch Stunden nach Wiederherstellung der Stromversorgung nicht erreichbar - noch schlimmer traf es die eCollaborationsplattformen.

Auch den Zugang zum Internet konnten über eine physikalischen DNS-Server und die Bereitstellung spontaner HotSpots schnell wiederhergestellt werden, so dass die gerade laufenden Web-Programming-Weeks nur am Rande betroffen waren (ok. Die SVN-Server waren nicht erreichbar).

Bleibt also zu hoffen, dass in Zukunft kritische Infrastruktur standortübergreifend redundant vorgehalten wird. Dies betrifft insbesoindere die eMail-Server, DNS-Server, die eCollaborationsplattformen und die Authentifizierungsdienste.