Temporärer HaDiFon-Ausfall – Anrufbeantworter defekt

Heute Nacht gegen 23:50 fiel die HaDiFon USV-Anlage im Serverraum K3 aus. Dadurch fiel die Hauptanlage aus, die alle Flurtelefone versorgt und damit Notruffunktionen bereitstellt. Gegen 00:40 konnten wir die Anlage wieder sicher mit Strom versorgen und in Betrieb nehmen.

Leider konnten wir den Anrufbeantworter nicht in Betrieb nehmen, warscheinlich wurde er beim Ausfall der USV beschädigt. Wir bemühen uns um schnellen Ersatz.

 

Die Anlage und ihr Switch wurden von uns auf die 5000VA APC USV des HaDiNets gehängt, damit der reibungslose Betrieb auch bei kurzfristigen Stromausfällen sichergestellt werden kann. Aktuell können wir 30 Minuten überbrücken.

Neue Switche (III)

Hadinet sprach „Es werde Licht!!“ und es ward Licht.

Am Montag Abend wurde die Bandbreite der Verbindung Coreswitch zu sw2u auf 2 Gbit/s verdoppelt. Dies wurde erreicht, indem eine zweite Glasfaser aktiviert und per Link_Aggregation mit der schon vorhandenen zusammengeschaltet wurde.

Im Zuge der Umbauarbeiten werden alle grossen Hausswitche des Typs HP E5412 (sw1, sw4, sw5) auf diese Weise zu mehr Bandbreite kommen. Switche des Typs HP E5406 (swp, sw2o, swg, swh) versorgen weniger Benutzer und sind somit schon sehr gut angebunden.

Neue Switche (II)

Hallo Hadiko!

Am Donnerstag wurden planmäßig die neuen Switche eingebaut. Dabei wurden insgesamt neun Avaya und ein Enterasys Switch durch drei HP E-Series v2 Switche (E5412 und E5406) ersetzt.

Durch den Austausch von „sw2u“ (K2, Flure D2-3, E1-3, F1-3) und „swh“ (K3, H Flügel) sind wir endlich die Avaya Problemstacks losgeworden und die Benutzer auf diesen Fluren sollten ab jetzt keine Probleme mit der Internetverbindung mehr haben. Ebenso wurde „swp“ (K2, P Flügel) getauscht.

Am Core Switch (K3 Serverraum, hier sind alle Häuserswitche angeschlossen) wurde das Chassis gewechselt um für zukünftige Anwendungen eine der kostenlosen Premium Lizenzen nutzen zu können.  Dies hat einen Hadiko-weiten Internetausfall von ca. 10 Minuten verursacht.

„sw2u is dead, long life sw2u“, „swh is dead, long life swh“ 🙂

In den folgenden Wochen werden noch einige Wartungsarbeiten durchgeführt, unter Anderem:

  • Neuverkabelung swg (K3, G Flügel): Die aktuelle Verkabelung ist abenteuerlich und folgt keinem Schema
  • Austausch sw5 (K5, komplett): 4 Enterasys -> 1 neuer HP
  • Einbau sw1 (K1, komplett): Hier wird der Switch vorbereitet. Wenn die Handwerker im K1 fertig sind, sollte das Umschalten von den alten Switchen (vier Avaya im A,B und C Flügel) sehr einfach sein und sofort alles funktionieren(tm).
  • Austausch sw2o (K2, Flure D,E,F 4-6): Ersatz durch einen neuen HP Switch. Hier warten wir noch darauf, dass die Bewohner die Abstellkammer zwischen D4 und E5 aufräumen

Vielen Dank an alle beteiligten Helfer und Tutoren.

IRC-Update

Hallo Hadiko,

heute wurden auf den beiden IRC-Servern des HaDiNets Updates eingespielt. Da es sich hier um wichtige Sicherheitsupdates handelte, war die Vorwarnzeit leider sehr knapp und es hat ein wenig länger gedauert als geplant. Die Server laufen wieder wie gewohnt und warten auf chatsüchtige User.

K5 Klimaanlage repariert

Hallo Hadiko,

Heute morgen war der Techniker da und hat die Klimaanlage im Serverraum K5 repariert – seit 18. August war sie ausser Betrieb. Gluecklicherweise gab es keine hitzebedingten Ausfaelle, sowohl die K5 Fluegelswitche als auch der Serverraumswitch und die Server haben mustergueltig durchgehalten. Bei gemuetlichen 22°C drehen die Luefter nun wieder gemaechlich ihre Runden.

Ausfall Klimaanlage im Serverraum K5 (again)

Die Klimaanlage im K5 ist wiedereinmal ausgefallen, wie beim letzten mal im Mai durch Vereisung. Verglichen mit Mai stehen inzwischen durch die fortlaufende Migration auf Virtuelle Maschinen (VMs) nur noch zwei Produktiv-Server. Dazu kommen die insgesamt 4 Switche, die die Bewohner des K5 mit Internet versorgen.

Der Techniker wird morgen frueh bestellt und wir hoffen dass die Anlage moeglichst bald wieder funktioniert – auch im Hinblick auf die Aussentemperaturen.

K5 Umbau und Renovierungsarbeiten am Montag, 25. Juli

=== Kurzversion ===
Was?            Wartung/Umbau
Wann?           Montag, 25.7.2011 13:00-20:00
Ausfälle?       Internet/Netzwerk K5, Heidi, BA-DB, DHCP
===================

Hallo zusammen,

am Montag, den 25.7.2011 wir das HaDinet seine Umbau- und
Renovierungsarbeiten weiter fortsetzen:
Diesmal ist der Serverraum im K5 an der Reihe.

Wir werden den Raum neu anordnen, alte Hardware ausbauen und die
Verkabelung neu anordnen.

Daher kann es zwischen 13:00 und 20:00 Uhr zu Unterbrechungen bei
folgenden Diensten kommen:
– Internet/Netzwerkzugang für die Bewohner im K5
– Zugriff auf die Datenbanken wie Heidi, BA-DB usw.
– Ausfall des DHCP-Servers

Dabei werden diese Dienste nicht volle 7 Stunden offline sein, sondern
es wird in diesem Zeitraum zu (mehreren) kürzeren Ausfällen kommen.

Wir bitten um euer Verständnis für diese Maßnahme.

IRC- und Shellserver Ausfall am Donnerstag, 09. Juni 21:00 Uhr [Update]

Hallo Hadiko,

wir werden beide IRC-Server und den Shellserver („home“) morgen Abend um 21:00 Uhr neu starten. Zweck des ganzen ist es, die virtuellen Maschinen für den Clusterbetrieb bereit zu machen, damit wir sie im Falle eines Problems oder zum Lastausgleich binnen weniger Sekunden zwischen den beiden VM-Servern hin- und herschieben können. Gleichzeitig werden auch wichtige Updates eingespielt. Der Ausfall sollte nicht länger als 30 Minuten dauern, wenn alles wie geplant funktioniert.

Wir bitten die Unannehmlichkeiten zu entschuldigen.

[Update]: Die Aktion war erfolgreich

Status der K5 Klimaanlage

Heute Mittag war der Techniker da und hat sich die Sache angeschaut. Offenbar klemmt ein Relais auf der Platine, sodass die Klimaanlage permanent gekuehlt hat und schlussendlich vereisst is. Die Hitze macht sich mittlerweile unangenehm bemerkbar, die Wikis waren zeitweise nicht erreichbar weil der Webserver aufgrund der Hitze mehrfach neu gestartet hatte.

Momentan warten wir, dass alles Eis in der Klimaanlage geschmolzen ist und haben zur Entlastung einige nicht wichtige Server heruntergefahren, nachdem Dienste auf andere Maschinen migriert wurden. Leider wird sich die Situation wohl erst naechste Woche beruhigen, denn die Platine muss erst von der Reperaturfirma bestellt werden und wird dort wohl erst am Montag eintreffen und wird dann so schnell wie moeglich eingebaut.

Euer HaDi²Net