Überwachung eines LSI SAS2 Controllers (SAS2008) mit Nagios

Der LSI SAS Controller wird durch das Kernel-Modul mpt2sas betrieben. Für das anzeigen des Status wird ein CLI Tool mit dem Namen sas2ircu benötigt. Aktuelle Debian bzw. Ubuntu Pakete sind auf der Webseite http://hwraid.le-vert.net/wiki/DebianPackages#no1 zu finden.

Damit man die Ausgabe dieses CLI Tools mit Nagios überwachen kann, benötigt man das Nagios-Plugin check_sas2ircu.

Damit das Nagios-Plugin funktionierte, muss es natürlich mit sudo gestartet werden. Damit dies funktioniert, muss man in die Datei /etc/sudoers noch die folgende Zeile eintragen:

nagios ALL=(ALL) NOPASSWD: /usr/lib/nagios/plugins/check_sas2ircu

Überwachung des 3ware Controllers SAS9750-8i mit Nagios

Um den Status eines RAID bei einem 3ware Controller abzufragen, gibt es ein CLI Tool mit dem Namen tw_cli. Jonas Genannt war so nett und hat dazu ein paar Debian-Pakete gebaut, die auch unter Ubuntu laufen. Diese findet man auf der Webseite http://jonas.genannt.name/.

Die Ausgabe dieses CLI Tools kann man dann wiederum mit Nagios überwachen. Dadurch bekommt man sofort mit, wenn eine Festplatte ausfällt. Ich habe dazu das Nagios-Plugin check_3ware_raid_1_1 verwendet. Es gibt aber auch noch diverse andere.

Damit das Nagios-Plugin funktionierte, musste ich allerdings einen Softlink für das tw_cli im Verzeichnis der Nagios-Plugins anlegen und das Nagios Plugin mit sudo starten. Damit dies funktioniert, muss man in die Datei /etc/sudoers natürlich noch die folgende Zeile eintragen:

nagios ALL=(ALL) NOPASSWD: /usr/lib/nagios/plugins/check_3ware_raid_1_1

IBM: Firmware-Update für LSI 1064e SAS Controller zerstört Systemboard

Die aktuelle Firmware von IBM (Version 2.66) für den LSI 1064e SAS Controller hat mir letzte Woche ein Systemboard eines IBM HS21 XM Blade gekillt. Nach der aktualisierung konnte man nicht mehr von der SSD booten. IBM hat heute ein neues Systemboard und einen Techniker geschickt. Auch das neue Systemboard konnte nach dem einspielen der Firmware nicht mehr booten. Jetzt soll Morgen ein neues, drittes Systemboard kommen. Verteilt IBM hier gerade eine Firmware, die reihenweise Systemboards zerstört?

Kein Linux 2.6 Kernelmodul für die IBM DS3000 Series mehr nach einem RHEL5 Sicherheitsupdate

Nachdem einige schwerwiegende Sicherheitslücken im Kernel von Linux entdeckt wurden habe ich alle unsere Linuxserver aktualisiert. Dabei war auch ein IBM-Server mit RHEL5 (Redhat Enterprise Linux 5), den ich wie von Redhat empfohlen, mit yum update aktualisierte. Nach dem anschließenden Neustart musste ich leider feststellen, dass das Kernelmodul für die IBM DS3000 Series nicht mehr funktionierte.
Wie sich heraus stellte, wird bei Redhat im Gegensatz zu Debian der Pfad der Kernelmodule auch bei Sicherheitsupdates geändert. Der Kernel kann die alten Kernelmodule nicht mehr finden, da die aktuellen Module nicht mehr unter /lib/modules/2.6.18-53.1.14.el5, sondern unter /lib/modules/2.6.18-53.1.19.el5 liegen.
Leider gibt es von IBM kein richtiges Softwarepaket für das Kernelmodul, sondern nur einen Link auf die Webseite von LSI, dem Hersteller der DS3000 Series: http://www.lsi.com/rdac/ds3000.html. Dort gibt es dann nur die Sourcen, mit denen man sich selber ein Kernelmodul kompilieren kann.
Fazit: Sobald ein Sicherheitsupdate den Kernel des RHEL5 aktualisiert, müssen die Treiber für die IBM DS3000 Series neu installiert werden. Bei einem zertifiziertem Betriebssystem und so teurer Hardware kann man eigentlich eine bessere Lösung erwarten.