seeadler (Compaq Deskpro PIII/733)
Systembeschreibung
CPU | Intel Pentium III (Coppermine), 733 MHz, 16 kB Level-1-I-Cache, 16 kB Level-1-D-Cache, 256 kB Level-2-Cache |
---|---|
Mainboard | unbekannt |
Chipset | Intel 82815 Rev. 02 |
BIOS | unbekannt |
RAM | 256 MB PC100 |
Schnittstellen | 2 x seriell, 2 x USB, RJ45 |
Grafik | onboard (Intel 82815 CGC) |
FDD | NEC FD1231T, 3,5" 1,44 MB |
HDD | hda: Quantum Fireball, 10 GB |
CD/DVD | hdc: Compaq CRD-8322B |
Netzwerk | Intel 82801BA/BAM/CA/CAM Ethernet controller (rev 01) onboard |
Februar 2006
Soll ich oder soll ich nicht …?
Ich liebäugele Anfang Februar mit der Anmietung eines Rootservers bei der Firma Netdirekt (JavaScript erforderlich) in Frankfurt/Main, die mir von Mitgliedern des Chaostreffs Heidelberg empfohlen wurde. Am 9. Februar schicke ich die Bestellung raus. Nach etwas Wartezeit wegen Lieferschwierigkeiten des Hardware-Lieferanten wird mir der 3. März als Lieferdatum bestätigt.
7. März 2006
Ich bekomme die Zugangsdaten für den Rootserver pünktlich am 3. März. Am 7. März schau ich mir das mal näher an. Da laufen ein paar Programme, die mir so gar nicht gefallen, insbesondere sendmail, das ich nicht wirklich konfigurieren will, und ein Admin-Tool namens ezad, das einige Pfade und Configs verbiegt. Der Kernel ist ein 2.6.8, der aber laut uname -a von Netdirekt verändert wurde. Den weiterhin laufenden proftpd schieße ich gleich ab und lösche ihn, denn einen ftpd will ich gar nicht laufen haben.
31. März 2006
Ich mache die Ursprungsinstallation (Debian Sarge mit einem Admin-Tool) platt und installiere von einem Image des Hosters eine „Debian minimal“. Aber auch davon bin ich nicht wirklich begeistert, denn dieses Image partitioniert mir die Platte sehr ungünstig: Es werden 2 GB als Swap angelegt, die mir dann natürlich im Betrieb fehlen. Die Anleitung von Netdirekt zum Selbst-Partitionieren ist allerdings sehr mager. Ich schreibe eine Mail mit einer entsprechenden Anfrage an Netdirekt.
22. April 2006
Immer noch keine Antwort vom Support bezüglich eigener Partitionierung. Weitere Versuche kann ich teils aus gesundheitlichen Gründen immer nur in Abständen unternehmen.
30. April 2006
Wie krieg ich da jetzt mein Wunsch-Debian drauf?
Ich suche und frage noch eimal herum. Im IRC-Channel des Heidelberger Chaostreffs nennt man mir eine Webseite, die die manuelle Installation von Debian Sarge auf einen Rootserver bei Netdirekt erklärt. Also ziehe ich die Basisinstallation von woody durch und schiebe gleich das Update auf sarge hinterher. Spannend, so eine Remote-Installation ;-) Meine Installation fragt ein paar andere Dinge ab als in der Anleitung beschrieben, aber das sehe ich nicht als Problem an. Den Kernelbau verschiebe ich dann allerdings, weil ich dafür frisch sein will.
1. Mai 2006
Fehler und Probleme …
Ich ziehe mir zunächst die Sourcen des aktuellen Kernels 2.6.16.11.
Dann suche ich mir die nötigen Daten zusammen. Schwierigkeiten habe ich damit, den IDE-Chipsatz herauszufinden. Ich probiere es mit dmesg | less, aber da sehe ich nur das hier:
hdc: command error: error=0x54 end_request: I/O error, dev 16:00 (hdc), sector 87280
hdc: command error: status=0x51 { DriveReady SeekComplete Error }
– und das immer wieder. Da hat die Rescue-CD wohl einige Probleme. Aber nicht nur die: Nachdem ich lspci entdeckt und die nötigen Daten ermittelt habe, lasse ich make laufen und bekomme einen Fehler:
include/linux/compiler.h:46: #error Sorry, your compiler is too old/not recognized.
# gcc --version: 2.95.4
Aber dann merke ich, daß ich eigentlich ein chroot vergessen habe, denn ich compiliere ja aus der Rescue-Umgebung heraus.
Ich wundere mich darüber, daß die Anleitung für die /etc/fstab ein „nodev“ vorgibt. Eine Debian-Mailingliste informiert mich darüber, daß es sich dabei um eine Sicherheitsmaßnahme handelt. Ich trage das mal so ein, und wenn ich Probleme bekomme, kann ich ja immer noch auf „defaults“ ändern.
Reboot mit neuem Kernel
Nach dem Reboot kann ich den Rechner von remote nicht mehr erreichen. Ich reboote über das Webinterface in den Rescue-Modus.
OK, man sollte den richtigen Netzwerktreiber in den Kernel einbauen, wenn man den schon selbst baut. Der Rechner hat eine Intel-Netzwerkkarte, und ich hatte wohl aus alter Gewohnheit eine RTL8139 angegeben. Das kann ja nicht gehen.
Mit dem nächsten Umweg übers Rescue-System finde ich außerdem heraus, daß ich in der /boot/grub/menu.lst einen Tippfehler, den ich auch gleich korrigiere. Reboot … und wieder meldet sich der Server nicht.
2. Mai 2006
In /var/log/messages steht alle 20 Minuten ein -- MARK --, also läuft die Maschine – eigentlich. ssh ist auch in den Boot-Scripten eingetragen. Allerdings fehlte in /etc/network/interfaces noch auto eth0. Reboot … und der Server meldet sich immer noch nicht.
4. Mai 2006
Ich rufe den Support von Netdirekt an. Dort erfahre ich, daß ich eventuell die Broadcast-Adresse falsch gesetzt habe. Die Änderung bringt aber keinen Erfolg – der Server will weiterhin nicht von außen erreichbar sein.
11. Mai 2006
Netdirekt bietet mir als Hilfe eine Art Video-Konsole an. Ich bekomme auf der mir genannten Webadresse jedoch nur das Logo der Konsolen-Software zu sehen. Ich frage per Mail an, woran das liegen könnte, und bekomme zur Antwort, ich solle bitte Popups und ActiveX-Steuerelemente aktivieren. Das heißt, ohne Internet Explorer kann man das gar nicht nutzen. Auf die Idee, daß jemand konsequent Freie Software einsetzt, kommt man da wohl nicht. Danke für's Gespräch …
14. Juli 2006
Vier Augen sehen mehr als zwei
Neuer Versuch. Das Booten in den Rescue-Modus (von der standardmäßig eingelegten Rescue-CD) dauert jeweils beim ersten Mal bis zu 45 Minuten. Braucht man den Reboot danach mehrfach hintereinander, geht es jeweils recht schnell. Ich kann weiterhin nicht im Normalmodus einloggen. Offenbar kommt der sshd nicht hoch, möglicherweise starten auch weitere Dienste nicht.
Nebenbei stelle ich fest, daß die Rescue-CD mittlerweile wohl mal ausgetauscht worden war, die hat nämlich nun eine neuere Kernelversion und dafür keine Lesefehler mehr.
Gut, wenn man Freunde hat und diese fragen kann. yalla lässt sich von mir einige Ausgaben schicken. Da das ganze sehr umständlich wird, gebe ich ihm schließlich root-access auf den Server. Und prompt findet er den Fehler: Auf Grund eines fehlenden Kommas in der /etc/fstab kann /usr nicht gemountet werden – und somit können auch keine Dienste starten. Kopf-auf-Tischkante
15. Juli 2006
No route to host
Trotzdem ist der Server nach Reboot nicht erreichbar, aber der Grund liegt nun vermutlich in den eingetragenen Routen. Um sicherzugehen, daß nicht der selbstgebaute Kernel das Problem ist, installiere ich einen Standard-Kernel. Das hilft mir aber auch nicht weiter.
Sieg!
Nach dem Reboot in den Rescue-Modus erfahre ich aus den Logs, daß der Standard-Kernel gar nicht erst gebootet hatte. Außerdem stelle ich fest, daß das Gateway gar nicht in der route steht. Gateway eingetragen und Selbstbau-Kernel reaktiviert – und ich kann zum ersten Mal seit der eigenen Installation im Normalmodus zugreifen! Da ich aber mein root-Passwort für den Normalmodus vergessen habe, muß ich nochmal in den Rescue-Modus zurück, um es zu resetten.
frosch@seeadler:~$ uname -a
Linux seeadler 2.6.17.5 #1 PREEMPT Sun Jul 16 17:46:02 CEST 2006 i686 GNU/Linux
25./26 Juli 2006
(Nachtrag aus Mailwechsel) Am 25. Juli um etwa 21:10 Uhr gibt es einen Ausfall eines Teils in der Stromversorgung. Am nächsten Tag ist das Problem wieder behoben.
10. August 2006
Ich installiere testweise die Blog-Software serendipity. Vorher war mir gesagt worden, das ginge in zwei Minuten. Nach 90 Minuten gebe ich entnervt auf.
1. November 2006
icecast2, erster Versuch
Ich installiere und konfiguriere icecast2, um (im privaten Umfeld) Internet-Radio selbst machen zu können. Allerdings gibt es da wohl noch ein Problem, denn wenn ich versuche, die Seiten des icecast2 aufzurufen (der ja einen eigenen Webserver auf einem anderen Port anbietet), bekomme ich 404.
21. Dezember 2006
Und jetzt: Radio!
Eine Chatterin aus Berlin sendet zum ersten Mal über den icecast2 an drei Hörer.
16. März 2007
fail2ban – oder auch fail2install
Zufällig stoße ich auf das Script fail2ban. Es soll IPs temporär blocken, von welchen aus zu viele Fehl-Logins kommen. Also versuche ich, es auf dem Server zu installieren:
seeadler:/usr/src/fail2ban-0.7.7# python2.4 setup.py install
running install
running build
running build_py
running build_scripts
running install_lib
running install_scripts
changing mode of /usr/bin/fail2ban-client to 755
changing mode of /usr/bin/fail2ban-server to 755
changing mode of /usr/bin/fail2ban-regex to 755
running install_data
Please to not forget to update your configuration files.
They are in /etc/fail2ban/.
seeadler:~# /etc/init.d/fail2ban start
/etc/init.d/fail2ban; line 55; /lib/lsb/init-functions: No such file or directory
Die Datei ist tatsächlich nicht vorhanden, und ich habe keine Ahnung, wo ich sie hernehmen soll. Auch nochmal compilieren hilft nichts. fail2ban bleibt inaktiv. Schade eigentlich.
23. März 2007
Trafficlog fehlerhaft
Bei der Überprüfung des Traffic-Logs im Webinterface von Netdirekt stelle ich fest, daß die Anzeige nicht stimmen kann. Für den 1. und den 8. März bekomme ich nur 8 MB Traffic pro Tag angezeigt, während normalerweise zwischen 36 und 72 MB pro Tag auflaufen. Das Apache-Log dagegen zeigt mir für diese Tage völlig normalen Betrieb an. OK, muß mich nicht stören, solange nicht mehr angezeigt wird, als im allgemeinen so durchläuft, aber ich hätte es eigentlich doch schon genauer.
14. April 2007
Blog-Software
Ich installiere an einem schönen Urlaubstag die Blog-Software blosxom, eigentlich nicht mehr als ein Perl-Script.
20. Dezember 2007
Bessere USV im RZ
Ab morgens um 2:00 Uhr werden mehrere Netzblöcke von Netdirekt heruntergefahren, um eine bessere unterbrechungsfreie Stromversorgung einzubauen.
9. März 2008
Netzausfall
(Nachtrag aus Mailverkehr) Ab 00:03 Uhr ist der Server nicht mehr erreichbar, Traceroutes von verschiedenen Orten in Deutschland aus enden jeweils vor dem Netz von Netdirekt (bei Tiscali bzw. im DeCIX) in Frankfurt. Nach einer Mail von mir 12 Stunden später erfahre ich, daß ein „next hop switch“ down war; direkt nach der Mail geht alles wieder.
4. September 2008
Reboot
(Nachtrag aus Mailverkehr) Um 11:36 Uhr fährt der Server einen harten Neustart. Der Grund ist aus den Logs nicht erkennbar, und auch bei Netdirekt weiß man keinen Rat: Es habe keinen Stromausfall etc. gegeben, und es waren auch keine anderen Rechner in derselben IP-Range betroffen. Das muß ich wohl im Auge behalten, wenn ich Pech habe, hat das Netzteil einen Hau.
23. Januar 2009
Neuer Kernel – oder nicht
(Nachtrag nach IRC-Logs) Ich compiliere einen neuen Kernel, um das tun-device für OpenVPN einzubinden, aber nach dem Reboot mag die Maschine nicht mehr hochkommen. Also setze ich den alten Kernel wieder ein.
9. Juni 2009
Netdirekt tauscht morgens die Netzwerkhardware eines Raumes, und mein Server ist mitbetroffen. Der Ausfall dauert aber nur ein paar Minuten.
4. Juli 2009
Immer noch kein OpenVPN
(Nachtrag nach IRC-Logs) Ich probiere das nochmal mit dem tun-device. Aber nix zu machen: Der 2.6.30 bootet nicht. Also baue ich den 2.6.24.3 nochmal mit tun, und dann mag er auch wieder booten.
5. Juli 2009
(Nachtrag aus IRC-Logs) Kurzfristig sind die Dienste nicht erreichbar: Mindestens Mailserver, Webseiten und bitlbee antworten nicht. IRC-Bot und irssi bleiben jedoch online.
7. Juli 2009
(Nachtrag aus IRC-Logs) Von 7:20 bis 9:20 Uhr ist der Server down, angekündigt war allerdings nichts. Auch der benachbarte Server der Stadt Hommingberg ist nicht erreichbar, sogar noch länger als meiner. Netdirekt erklärt später per Mail, daß es einen Stromausfall im RZ gegeben habe.
12. Juli 2009
Upgrade Etch → Lenny
(Nachtrag aus IRC-Logs) Nach dem Upgrade (per apt-get, wie bei mir üblich) funktioniert das Mailsystem nicht mehr, bitlbee besteht trotz anderer Konfiguration auf Port 6668, und im irssi hat es das Logging verbogen.
20. Juli 2009
OpenVPN hatte ich ja eigentlich für ein paar User aus dem Iran eingerichtet. Aber genau die können jetzt nicht mehr drauf. Einen Zusammenhang mit dem Update auf Lenny schließen wir aus, weil die Probleme erst 15 Stunden danach auftraten. Nach den Logs zu schließen wird die Verbindung nach der clientseitig gesendeten Sequenz STARTTLS gekappt. Damit ist OpenVPN erstmal sinnlos geworden.
31. Juli 2009
Alle Dienste weg?
(Nachtrag nach IRC-Logs) Um etwa 15:11 Uhr fallen der IRC-Bot und der irssi aus dem Netz, um 15:27 Uhr werden die bitlbee-User runtergeworfen. Auch alle anderen Dienste antworten nicht mehr. Ich boote in den Rescue-Modus; in den Logs steht was von einem RAM-Überlauf, den möglicherweise das immer noch nicht wirklich funktionierende dovecot ausgelöst hat. Nach Reboot ins Produktivsystem läuft alles wieder, als wäre nichts gewesen. dovecot und postfix stoppe ich sofort nach dem Neustart, damit das nicht nochmal passiert.
10. August 2009
Ab 11:21 Uhr wieder das gleiche Spiel wie vor zwei Wochen: Bot fällt raus, irssi fällt raus, eine gute Stunde später fliegen die User vom bitlbee, alle anderen Dienste sind auch weg. Nur ping geht noch durch. dovecot war es diesmal definitiv nicht, das lief nämlich gar nicht. Die letzten Log-Einträge sind von 11:18 Uhr, danach ist Schweigen. Es gibt auch keinen Hinweis darauf, daß das RAM wieder vollgelaufen war. Nach Reboot geht auch diesmal alles wieder normal weiter. Von Nurbs bekomme ich ein kleines Script zur Überwachung diverser Funktionen.
19. August 2009
Alle Dienste weg, zum Dritten. Im Backlog des ZNC habe ich noch die Meldung einer Userin von 17:56 Uhr, daß sie nicht zum bitlbee connecten kann. Nur ping geht wie üblich durch. Um ca. 19:45 Uhr reboote ich, diesmal ohne Umweg übers Rescue-System, das scheint eh nichts zu bringen.
22. August 2009
Mit top stelle ich fest, daß das RAM schon wieder vollzulaufen droht. Apache will allein 250 MB haben. Ich restarte den Webserver, damit kommt er auf 165 MB runter, klettert aber sehr schnell wieder hoch. Möglicherweise ist dieser Fehler schuld dran.
1. September 2009
Beginn Umzug
Nachdem ich eine Virtual Machine auf einem fetten Server angeboten bekommen habe, ziehe ich die Dienste Stück für Stück dorthin um. seeadler bekommt nur noch Standard-Updates. Der Webserver geht als erstes auf die neue Maschine. Und nach netter Nachhilfe aus dem Chaosdorf läuft auf der neuen Maschine auch das Mailsystem wieder, das seit Juli down war.
19. September 2009
bitlbee ist auf den neuen Server umgezogen. Dort läuft er interessanterweise jetzt standardmäßig auf Port 6667.
15. Oktober 2009
Rente
Ich kündige den Server per Einschreiben und teile gleichzeitig mit, daß ich den Server gern auslösen möchte.
16. Oktober 2009
Die Kündigung ist laut Bestätigung von Netdirekt zwar zu früh, ich müßte eigentlich bis Februar warten, aber ich vermute, Netdirekt ist ganz froh, diese alten und vermutlich relativ viel Strom fressenden Boxen loszuwerden. Mir wird das Ende der Vertragslaufzeit zum 31. Oktober bestätigt.
30. Oktober 2009
Weil ich die entsprechende Rückmeldung verpennt habe, ruft mich Netdirekt freundlicherweise an, um mich dran zu erinnern. Ich bestätige nochmal per Mail, daß ich den Server kaufen möchte. Ich soll nun auf die Abschlußrechnung warten, und wenn die bezahlt ist, wird der Rechner losgeschickt.
16. November 2009
Server auf Reisen
Laut Mailbestätigung soll der Server heute zu GLS gehen.
17. November 2009
Der Adler ist gelandet
Der Server ist bei mir angekommen. Und so sieht er aus:
21. Januar 2010
Suche nach alten Logs
Mir war aufgefallen, daß mir ein paar Logfiles des Apachen durch die Lappen gegangen sind. Daher reaktiviere ich den Rechner. Aber der tritt erstmal in Streik. Zuerst bekomme ich vom BIOS die Meldung, daß das RAM nicht in Ordnung sei, beim nächsten Mal beklagt er sich, daß die CMOS checksum nicht stimmen würde. Beim dritten Mal (Setup-Daten neu gespeichert) beschwert er sich, daß Datum und Uhrzeit nicht gesetzt seien. Haben die etwa die BIOS-Batterie ausgebaut? Er läßt sich erstmal booten, läuft dann aber in einen harten Reset!
Neuer Versuch. Ich gehe durch die BIOS-Einstellungen und verändere ein paar wenige Werte. Während des Bootens fällt mir auf, daß das CD-Rom sich verhält, als sei ein Medium drin. Und prompt finde ich nach dem Öffnen eine CD mit der Aufschrift „AUTO RESCUE 29.3.2006“. Aha. Die wurde da wohl vergessen. – Beim Weiterbooten prüft er jetzt nochmal ganz ausführlich die Festplatte und kommt dann tatsächlich hoch. Einige Dienste beklagen sich, daß sie nicht starten können, aber das ist kein Wunder, er hängt ja nicht mehr in seinem bisherigen IP-Bereich (die Daten stehen fest in /etc/network/interfaces.
Nächstes Hindernis: Das bisherige Root-Paßwort wird nicht angenommen. Mit ein wenig Ausprobieren stelle ich fest, daß die Tastatur auf QWERTY eingestellt ist. Dann kann das nicht gehen, wenn das Paßwort ein Z enthält. ;-)
Ich ändere noch die Netzwerkeinstellungen, sodaß seeadler in meinem LAN gefunden wird, dann suche ich nach den vermißten Logs. Und die sind tatsächlich noch vorhanden.
3. März 2010
Zu neuen Ufern
Der Rechner bekommt neue Aufgaben.