Ach hat geschrieben: ↑11. Mär 2021 16:44
Ein Rechenzentrum wäre sicherlich auch nochmal spannend, haben wir bisher noch gar nicht unter unseren Kunden.
Yo, Rechenzentren, da kannste was erleben, das ist in der Tat spannend, ich kann nur jedem empfehlen alles in die Cloud zu packen:
((Aus dem Schadenbericht eines großen deutschen RZ, habe ein paar Informationen und das Datum rausgenommen))
ca. 19:30 Uhr [RZ-Betreiber] informiert seine Kunden, dass ein Mittelspannungs-Transformator ausgefallen ist und am kommenden Tag ausgetauscht wird. Die Situation wird seitens [RZ-Betreiber] als unkritisch eingestuft.
ca. 21:00 Uhr bis 21:40 Uhr Zwei der drei Diesel-Generatoren fallen aus. Der dritte Diesel-Generator alleine reicht nicht aus, um das Rechenzentrum mit Strom zu versorgen. Zunächst übernehmen die Batterien die weitere Versorgung bis diese leer sind.
Um ca. 21:40 Uhr fällt der Strom vollständig aus. Eskalation an das [RZ-Betreiber] Senior Management Team.
ca. 21:20 Uhr RZ-Co-Location-Kunden registrieren Unregelmäßigkeiten in der Stromversorgung.
21:45 Uhr Techniker des RZ-Co-Location-Kunden treffen vor Ort am Rechenzentrum ein, stellen kompletten Stromausfall des Gebäudes fest; Zutritt zum Gebäude ist aus Sicherheitsgründen nicht erlaubt.
ab ca. 21:45 Uhr Analysieren der Fehlerursache der Ersatz-Stromversorgung sowie des MS-Trafos 1. MS-Trafo 2 des RZ kann leittechnisch nicht aufgeschaltet werden.
ca. 00:20 Uhr Zwei mobile Diesel-Generatoren werden bestellt, die Fehlerursache für das Versagen der Ersatz-Stromversorgung konnte bisher nicht lokalisiert werden.
ca. 01:10 Uhr Defekter MS-Trafo ist abgekühlt. Lastflüsse werden zwischen Tr1 und Tr2 geteilt
ca. 02:00 Uhr Start Wiederanlaufplan RZ
ab ca. 03:50 Uhr MS-Trafo1 überhitzt erneut. Stromversorgung bricht erneut zusammen. Der Fehler der Ersatz-Stromversorgung konnte bisher nicht identifiziert werden. Es wird mit den Arbeiten begonnen die gesamte Stromversorgung über Tr2 laufen zu lassen.
ab ca. 5:40 Uhr Tr2 übernimmt die gesamte Last für das RZ. Stromversorgung steht wieder zur Verfügung, Redundanz durch Diesel-Generatoren ist noch nicht gegeben. Erneuter Wiederanlaufplan. Parallel dazu müssen diverse defekte Hardwarekomponenten getauscht werden.
Ursache: Fehler 1: Ein MS-Trafo war defekt. Fehler 2: Ein undichtes Stickstofffläschchen hat zu einem Druckabfall geführt, woraufhin das Leckage-Warnsystem die Dieselzufuhr automatisch gestoppt hat, mit der Folge, dass zwei Diesel-Aggregate abgesetzt wurden. Das wäre an Bord eines Schiffes etwas anders gelaufen, aber da ist auch 24/7 Personal mit entsprechenden Befähigungsnachweisen zugegen (ich habe so ein Patent
) und das Ganze ist eher rustikal als automatisiert.