Hosteurope und die Snapshots

So nach ca. 24 Stunden Downtime ist exdc.net wieder da. Grund war ein zurueckspielen eines Snapshots der VM bei Hosteurope. Da ich schauen wollte wie sich die VM beim Upgrade auf Squeeze schlaegt, habe ich erst ein Snapshot angelegt und dann mich an das Upgrade gewagt. Da ich 1-2 Sachen in den Foren ueber die Snapshotfunktion bei Hosteurope gelesen hatte und eigentlich bis vorgestern recht zufrieden mit HE war, ging ich davon aus, dass auch ein Zurueckspielen problemlos laufen wuerde. Falsch gedacht, das war alles eine mittlere Katastrophe. Vielleicht lag der Fehler bei mir, vielleicht bei Hosteurope. Ich tendiere stark zu Hosteurope. Nachdem das Upgrade mit recht viel Anpassungen in den Konfigurationsdateien verbunden war, habe ich mich entschlossen wieder zu Debian 5.0 zu wechseln. Also den Snapshotrueckspiel Prozess angestossen. Dieser dauerte geschlagene 10 Stunden und ein paar Minuten. Am Donnerstag Morgen bekam ich dann die mail (die man wohl immer bekommt nach einer solchen Aktion), dass der Vorgang abgeschloissen waere, man aber nicht ueberpruefen koenne ob auch alles korrekt zurueckspielt wurde. Tatsaechlich war da irgendein Stand des Systems wieder hergestellt wurden, aber definitiv nicht der Stand des von mir angelegten Snapshots. Die Mysql DB war von vorgestern oder so und das System war erstaunlicherweise immer noch Debian 6.0. In den Logs stand irgendwas von error und anscheinend hat er beim Einspielen bei 80% aufgehoert. Gut was tun? In der mail stand was von, „falls es Probleme gibt, fuehren sie den Prozess einfach nochmal aus“. Ok Donnerstag 11 Uhr, zweiter Versuch. Donnerstag kurz nach 21 Uhr war er fertig. Tatsaechlich hat er wieder irgendein Zeug zurueckgespielt, aber nicht das was ich wollte. Der Support meinte dann heute zu mir, dass mein Backup anscheinend nicht konsistent waere. gluecklicherweise habe ich noch ein zusaetzliches Dateibackup der Daten gehabt. Mich stoeren bei der ganzen Sache genau zwei Dinge

1. Warum dauert es ueber 10 Stunden 40 Gig zurueckzuspielen.
2. Warum werden Snapshots angeboten wenn sie anscheinend nicht funktionieren.

Das ganze ist erstmal unter Vorbehalt. Vielleicht stellt sich auch noch heraus, dass ich was falsch gemacht habe, aber bei solchen kapitalen Maengeln kann man Hosteurope  nicht empfehlen. Solche Dienste muessen funktionieren oder sie duerfen nicht angeboten werden, so einfach ist das.

 

Update 13.09.2012:

Ich bin noch bei Hosteurope. Ignoriert man die Snapshotfunktion, läuft eigentlich (ausser 1-2 Lastprobleme alle paar Monate) alles wunderbar.

Dell Poweredge und Bios Update unter Debian Squeeze

Getestet mit Dell Poweredge 1950/2650 und Debian Squeeze 64/32bit

Ich habe mich groesstenteils an dies Howto gehalten.

Grund fuer das Biosupdate waren Meldungen wie:

PCIE NonFatal Er: Non Fatal IO Group sensor, PCIe error (Bus 0 Device 0 Function 0) was asserted
I/O Fatal Err: Fatal IO Group sensor, fatal IO error was asserted

bei

omreport system esmlog

Also fangen wir an.

aptitude install libsmbios-bin libsmbios2

dann schauen wir mal was wir laufen haben:

getSystemId
Libsmbios:    2.0.3
System ID:    0x01B3
Service Tag:  XXXXXXX
Express Service Code: 43156152163
Product Name: PowerEdge 1950
BIOS Version: 2.5.0
Vendor:       Dell Inc.
Is Dell:      1

Dann gehen wir auf http://linux.dell.com/repo/firmware/bios-hdrs/ und holen und das neue Bios. Dabei ist die System ID wichtig. Fuer mein System gab es ein aktuelles Bios  unter

http://linux.dell.com/repo/firmware/bios-hdrs/system_bios_ven_0x1028_dev_0x01b3_version_2.7.0/

finden. Die version_2.7.0 ist dabei die Biosversion.  Also weiter mit

wget http://linux.dell.com/repo/firmware/bios-hdrs/system_bios_ven_0x1028_dev_0x01b3_version_2.7.0/bios.hdr

dann machen wir ein

modprobe dell_rbu

mit

lsmod|grep dell

schauen wir ob das Modul geladen wurde. In der anderen Anleitung steht noch was  von firmware_class dell_rbu, gab es aber bei mir nicht.
Nun ein

#dellBiosUpdate -u -f bios.hdr
Supported RBU type for this system: (MONOLITHIC, PACKET)
Using RBU v2 driver. Initializing Driver.
Setting RBU type in v2 driver to: PACKET
writing (4096) to file: /sys/devices/platform/dell_rbu/packet_size
Writing RBU data (4096bytes/dot): ..............................
Done writing packet data.
Activate CMOS bit to notify BIOS that update is ready on next boot.
Update staged sucessfully. BIOS update will occur on next reboot.

Danach rebooten. Beim booten wird Das Biosupdate dann ausgefuehrt.  Ueberpruefen ob das neue Bios auch  laeuft (steht natuerlich auch schon beim booten da):

#getSystemId
Libsmbios:    2.0.3
System ID:    0x01B3
Service Tag:  JTQ244J
Express Service Code: 43156152163
Product Name: PowerEdge 1950
BIOS Version: 2.7.0
Vendor:       Dell Inc.
Is Dell:      1

Das wars. Ach ja, damit das LCD Display wieder blau wird und die Fehlermeldungen verschwinden, muss man noch das Hardwarelog loeschen. Kann man ueber die DRAC machen, so wie ich, aber sicherlich auch ueber omconfig, einfach mal hier schauen.

Mysql Slave stoppen

Da ich grad bei der Mysqlreplikation Master und Slave gewechselt habe:
um den Slave zu entfernen (die entsprechenden Eintraege der /etc/mysql/my.cnf anpassen):

  1. STOP SLAVE;
  2. RESET SLAVE;

bei show slave status sollte dann nur noch ein

mysql> show slave status\G;
Empty set (0.00 sec)

kommen. Natuerlich auf dem Slave ausfuehren.

update auf ubuntu 11.04 und X startet nicht

Da es mir nun schon bei zwei Maschinen mit Nvidia Karte passiert ist. Von 10.10 auf 11.04 geupdatet und statt gdm kommt nur die Konsole. Grund war ein halbfertiges Update. Die Header Dateien fuer den aktuellen Kernel wurden nicht richtig installiert. Daraus folgt, dass auch das Nvidia Modul fuer den aktuellen Kernel nicht eingerichtet werden konnte. Also einfach manuell noch

??aptitude install linux-headers-generic-pae????

(Ich hab direkt die linux-headers-2.6.38-8-generic-pae genommen)
Dann nochmal ein

?aptitude install

vielleicht hab ich auch apt-get install gemacht, kann ich grad nicht mehr genau sagen. Zum Abschluss ein

?aptitude full-upgrade

kann auch ein apt-get dist-upgrade gewesen sein ;-).

Nicht auf den Boden spucken!

Kann man schnell durchlesen. Die Welt auf das wesentliche zusammengefasst, genau wie die benutzte Sprache. Ich unterstelle Herrn McCarthy mal, dass er die Sprache bewusst so farblos gewaehlt hat um die Hoffnungslosigkeit einer kalten und verlassenen Welt hervorzuheben. Die Guten, die Feuerbewahrer, die kein Menschenfleisch essen, die niemanden bestehlen sind Vater und Sohn…bis zum Schluss.

Miller kehrt 1939 in die USA zurueck. Er beschreibt das Leben wie er es sieht, beschreibt Kuenstler und deren Hintergrund, beschreibt Staedte, beschreibt Automechaniker, beschreibt was er traeumt, was er hasst und was er liebt. Vielleicht nicht das erste Buch was man von Miller lesen sollte, aber sicher eines seiner besten (ja ich bin Miller Fan ;-)). Millers Erzaehlstil ist manchmal krickelkrackel, manchmal sehr lebendig, manchmal…wahnsinnig. Ein paar Stellen gegen Ende haben mich stark an die „Traumpassage“ aus Celinés Tod auf Kredit erinnert.

Centreon 2.2.0 und Nagios 3.06

Nach dem Update auf Centreon 2.2.0 lieferte Nagios beim generieren der Konfigurationsdateien

Error in configuration file ‚/usr/local/centreon/filesGeneration/nagiosCFG/1/nagiosCFG.DEBUG‘ – Line 91 (UNKNOWN VARIABLE)

Grund war die Variable check_for_updates, die von Centreon gesetzt wird aber meinem Nagios noch nicht bekannt ist (wohl erst ab 3.1.0). Die Variable kann nicht im Centreon Webinterface gesetzt werden, sondern steht hardcoded in der Datei (variiert je nach Installation)

/usr/local/centreon/www/include/configuration/configGenerate/genMainFile.php

Dort einfach am Ende der Datei die  Zeilen

if (isset($tab['monitoring_engine']) && $tab['monitoring_engine'] == "NAGIOS") {
$str .= "check_for_updates=0\n";
}

auskommentieren und schon sollte wieder alles funktionieren.

update:
also doch apt-get install dpkg aptitude apt && apt-get dist-upgrade
und mitten beim Updaten verlaesst uns eine der beiden Raid-1 Systemplatten und man denkt natuerlich egal macht ja alles der Raidcontroller…einen Scheiss macht der.
Also hard reset und weitermachen…