Zum Inhalt springen

Linux-Troubleshooting Schulung


lordy

Empfohlene Beiträge

Hallo,

für meine Kollegen soll ich demnächst eine Schulung zum Thema "Linux-Troubleshooting" halten. Wir kümmern uns um den Betrieb von insgesamt ca. 500 Servern (mit allen möglichen Anwendungen) und soll z.B. unseren Datenbankadministratoren ein paar tiefergehende Kenntnisse vermitteln.

Für die Schulung sind leider nur erstmal 60 Minuten angesetzt (eigentlich ein Witz), aber ich will versuchen, das Beste aus der Zeit zu machen. Ich bin nun einmal die Themenliste der LPIC 101 Prüfung durchgegangen, die auch reichlichen Themen liefert, aber das ist einfach viel zu viel (vom Bootloader bis zu Shell-Tricks).

Meine Frage daher an Euch: Welche Themen würdet Ihr in solch einer Schulung behandeln/erwarten ? Als Grundvorraussetzung nehme ich immer ein halbwegs lauffähiges System an (also keine defekte HW), es soll mehr um die Prozesse, Logfiles, etc. gehen.

Ich hatte mir z.B. folgende Sachen gedacht:

- Wie finde ich das Logfile zu einem Prozess ?

- Wie finde ich raus, zu welchem Prozess eine Datei gehört ?

- Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc)

- Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ?

- Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc)

Würde mich über Anregungen freuen :)

Link zu diesem Kommentar
Auf anderen Seiten teilen

Bei 60 Minuten würde ich ehrlich gesagt gar nichts erwarten. Die Auswahl scheint mir ganz passend zu sein, das ist aber natürlich abhängig vom Zielpublikum. Mit kill, pkill, top und grep könnte man Profis natürlich auch langweilen. Das Thema Shell könnte eigentlich schon für sich genommen einen ganzen Tag und mehr füllen.

Unter Troubleshooting könnte ich mir vorstellen, wie ich Abhängigkeiten zwischen Bibliotheken auflösen kann, was man bei Kernel Panic machen kann oder wie ich das Ding ans Netz kriege. Letztlich alle Sachen, die letztlich elementar sind, damit man mit dem Ding überhaupt wieder arbeiten kann. Wie ich Prozesse killen kann, kann ich ansonsten auch schnell über Google herausfinden, aber wenn das Ding gar nichts mehr macht und ich gerade vor dem einzigen PC stehe, muss ich evtl. allein auf das eigene Wissen zurückgreifen.

Naja, aber das sind wohl Schulungsinhalte, die man nicht direkt an den Kopf geknallt bekäme, sondern erst später. Insofern finde ich die Auswahl als Grundlage in Ordnung.

Link zu diesem Kommentar
Auf anderen Seiten teilen

- Wie finde ich das Logfile zu einem Prozess ?

- Wie finde ich raus, zu welchem Prozess eine Datei gehört ?

- Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc)

- Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ?

- Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc)

Evtl. noch (s)locate (anstelle von find),grep und awk (ansatzweise) und damit hättest Du schon mehr als 'ne Stunde voll.

Achja: und chrooten in ein System, falls man sich versehentlich selbst ausgesperrt hat ;)

Link zu diesem Kommentar
Auf anderen Seiten teilen

Also es geht hauptsächlich darum die Leute, die eben keine Profi-Sysadmins sind (z.B. unsere Datenbank-Spezis) ein paar Hilfsmittel an die Hand zu geben für die Rufbereitschaft. In der RB schlagen sehr selten HW-Ausfälle oder ähnliches auf, meistens geht es um "Prozess läuft nicht, oder hängt", "Cronjob ist abgebrochen", "komische Meldung im Log", sowas in der Art.

Grundsätzlich haben wir alle Kisten doppelt oder mehrfach sodass wir den HW-Ausfall einer Kiste in der RB überstehen können und die Leute können notfalls auch die Profi-Sysadmins anrufen, aber die möchten natürlich auch mal schlafen ;)

Über User-Verwaltung (in unserem Fall LDAP) hatte ich schon nachgedacht, aber das alleine füllt (mehr als) eine Stunde.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Denke immer dran ... gefährliches Halbwissen heisst nicht umsonst so. Ich habe mal ein paar Usern die system tools top, iostat, prstat, vmstat, etc. gezeigt und dann kamen diese "reserveadmins" auf einmal an mit irgendwelchen verrückten Thesen über load average und sonstigem Unfug, wenn mal was nicht so funktionierte wie sie wollten. Aber diese Erfahrung nur am Rande.

Ich denke für eine Stunde haste doch mehr schon als genug Stoff. Vielleicht kannst ja noch sowas reinnehmen wie "Wie mache ich einen manuellen failover der db im cluster?", wenn das nicht automatisiert sein sollte.

Bearbeitet von bigvic
Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...