Zum Inhalt springen
  • 0

Monitoring System überwachen. Bei Ausfall Meldung erhalten?


Budspencer

Frage

Für meine zukünftige Projektarbeit (FiSi), werde ich ein Monitoring System aufsetzten (vermutlich Zabbix oder Nagios)
Das beste System bringt nichts wenn es Offline ist, wie überwache ich mit einfachen Mitteln den Monitoring Server, so das bei einem HW Defekt etc. eine Meldung erhalte?

Danke und frohes neues 🙂

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

13 Antworten auf diese Frage

Empfohlene Beiträge

  • 0
vor 1 Stunde schrieb MiaMuh:

Ignoriert meine Antwort, ist eine Projektarbeit und da darf man nicht helfen...

 

Okayyyy 🤨... Ich habe nicht nach einer vollständig fertigen Lösung gefragt, sondern um Tipps.
Und natürlich darf man helfen, in dem man Hinweise gibt wie "Das Problem könntest du mit einem Heartbeat oder ähnlichem lösen" . 

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 1 Minute schrieb Budspencer:

Okayyyy 🤨... Ich habe nicht nach einer vollständig fertigen Lösung gefragt, sondern um Tipps.
Und natürlich darf man helfen, in dem man Hinweise gibt wie "Das Problem könntest du mit einem Heartbeat oder ähnlichem lösen" . 

Nope, die Projektarbeit soll selbstständig durchgeführt werden. Du hast ein Problem und willst es lösen.

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0

Definiere für dich detailliert, welche Defekte du abdecken möchtest und suche einen Work Around.

Pings, Ports, Services etc. können beispielsweise problemlos über ein PowerShell-Script abgefragt werden.  CPU, Festplattenspeicher und derartiges sehe ich nicht als notwendig für eine Sonderüberwachung an, würde aber auch klappen*. 

*Insofern du "nur" einen Monitoring-Server hast. 

Das Vorgehen ist aber abhängig davon was genau du überwachen möchtest, das ist aber auch Bestandteil deines Projektes das zu definieren und zu lösen :)

 

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0

@Asura Danke für deine Rückmeldung. 
Für meine Projekt ist bereits alles definiert, in der Projektarbeit setzte ich ein Monitoring System (Debian Linux Server) mit entsprechender Lösung wie Nagios/Zabbix/Prometheus auf, das überwacht das gesamte Netzwerk, Server, Switches, Kameras, WiFi AP, etc. so weit klar.

Es geht lediglich, um "Ist der Monitor Server Online"


Bei einem ähnlichen Projekt hat @charmanta  die durchaus berechtige Frage gestellt
"Können Sie sich auf den Monitoring-Server verlassen? Wie stellen Sie sicher das dieser funktioniert, um seine Aufgabe die Überwachung wahrzunehmen" das ist eine durchaus mögliche Frage.

Da mir im System kein Computer zur Verfügung steht der 24/7 an ist, nur 3 Synology NAS Server, bin ich am überlegen wie ich das am besten (einfach, kostengünstig) lösen kann, es soll nur gemeldet werden, dass der Monitoring Server Offline ist, damit ein Administrator dahin dackelt und schaut was los ist.

Denkbar wäre ein simples Skript auf eine der NAS der alle 60 Sekunden eine Ping anfrage, stellt, schlägt dieser Fehl, sendet er eine Mail an den Admin. Das ganze per Cronjob gelöscht wird, den dann müsste das immer von jemanden kontrolliert und edittiert werden.

 

So fern es keine bessere Lösung gibt, ohne ein zweites Monitoring System aufzusetzten (was ich nicht machen werde) ist das aus meiner Sicht die einfachste, denkbar beste Lösung.

 

 

Bearbeitet von Budspencer
Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 56 Minuten schrieb Budspencer:

Für meine Projekt ist bereits alles definiert,

Ich spreche über die Definition, welche Dinge überwacht werden müssen damit dein Monitoring Server als Online deklariert wird. Der Server kann erreichbar sein, aber dennoch kann das Monitoring System nicht funktionieren. 
Was würde das Monitoring zum Stoppen bringen? Wenn du klar definieren kannst, was die Ursachen sein können, kannst du entsprechende Lösungen einfacher implementieren. 

Der Server kann auch auf einen Ping antworten, dennoch gecrasht sein. 
Der Server kann laufen, bringt aber alles nichts, wenn die Dienste beendet sind und/oder bei einem Neustart nicht mehr aktiviert werden können. 

Diese Problematik ist für dieses Projekt aber nicht so groß, dass du deine unter Umständen knappe und wertvolle Zeit lange dafür opfern müsstest. 

vor einer Stunde schrieb Budspencer:

Das ganze per Cronjob gelöscht wird, den dann müsste das immer von jemanden kontrolliert und edittiert werden.

Was müsste editiert und kontrolliert werden? Cronjobs verwendet man für monotone automatisierende/vereinfachende Tasks, damit man nicht ständig kontrollieren und editieren muss. 

Wenn du nur überprüfen möchtest, ob ein Server erreichbar ist, dann Ping und los, aber das würde nicht die Frage: "Können Sie sich auf das Monitoring verlassen?" vollends beantworten. 

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 5 Stunden schrieb Budspencer:

Das beste System bringt nichts wenn es Offline ist, wie überwache ich mit einfachen Mitteln den Monitoring Server, so das bei einem HW Defekt etc. eine Meldung erhalte?

 

Quis custodiet ipsos custodes?
So jedenfalls der alte Lateiner. Wer überwacht die Wächter? @Asura hat es ja schon auf den Punkt gebracht. Die Hardware selber könnte man über iLO oder iDRAC selber überwachen. Ob dir das reicht wäre Thema für das Projekt.

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor einer Stunde schrieb Asura:

Ich spreche über die Definition, welche Dinge überwacht werden müssen damit dein Monitoring Server als Online deklariert wird. Der Server kann erreichbar sein, aber dennoch kann das Monitoring System nicht funktionieren. 
Was würde das Monitoring zum Stoppen bringen? Wenn du klar definieren kannst, was die Ursachen sein können, kannst du entsprechende Lösungen einfacher implementieren. 

Der Server kann auch auf einen Ping antworten, dennoch gecrasht sein. 
Der Server kann laufen, bringt aber alles nichts, wenn die Dienste beendet sind und/oder bei einem Neustart nicht mehr aktiviert werden können. 

Danke für die "guten Fragen". 👍

 

Ich bin mir nicht sicher was das System stören könnte, ein Stromausfall jedenfalls nicht, das regelt die USV.
Das Einzige, was ich mir vorstellen kann, ist ein Hardware defekt direkt am Server oder Switch.
Ich kann die Abfrage so erweitern, dass der Server per ping geprüft wird und der HTTP Dienst (Zabbix, Nagios) per curl.
Damit ist sichergestellt das der Server läuft und der Monitoring Dienst gestartet wurde.

 

 

 

vor einer Stunde schrieb Asura:

Was müsste editiert und kontrolliert werden? Cronjobs verwendet man für monotone automatisierende/vereinfachende Tasks, damit man nicht ständig kontrollieren und editieren muss. 

Wenn du nur überprüfen möchtest, ob ein Server erreichbar ist, dann Ping und los, aber das würde nicht die Frage: "Können Sie sich auf das Monitoring verlassen?" vollends beantworten. 

Zitat

Snology uses upstart and that fires the job /usr/share/init/root-file-system.conf at some point, which itself uses a script named /usr/syno/sbin/config_bootup_check.sh. That contains logic to backup, delete and restore /etc and other important directories like /root/.ssh, but I'm not sure if that happens on every reboot or only during upgrades. Additionally there's /etc.defaults which seems to be replaced by every upgrade, so customizations in that seem to be lost.

 

 Ich weis, wofür cronjobs verwendet werden (wiederkehrende Aufgaben). 🙂
Ich muss prüfen, ob nach einem Reboot/Update/Upgrade des Synology Servers (darüber gibt es keine Dokumenation), mein manuell angepasster "cronjob" bestehen bleibt oder das vom System wiederhergestellt wird und damit meine Einträge gelöscht werden. Dass meinte ich mit prüfen und ggfs. anpassen.
Ist aber nicht so wichtig.

Jedenfalls besten Dank für deine Fragen, haben mir schon sehr geholfen 👍

 

 

Bearbeitet von Budspencer
Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 16 Minuten schrieb Chief Wiggum:

Quis custodiet ipsos custodes?
So jedenfalls der alte Lateiner. Wer überwacht die Wächter? @Asura hat es ja schon auf den Punkt gebracht. Die Hardware selber könnte man über iLO oder iDRAC selber überwachen. Ob dir das reicht wäre Thema für das Projekt.

Oder die Moderne Version aus „Who watches the Watchmen?“ 🙂

Danke für den Tipp mit iLO / iDARC, es wird leider ein andere Hersteller im Netzwerk verwendet. 
Ich denke die abfrage per ping und curl sollte reichen um sicher zu gehen dass der Server up ist und der Dienst läuft.

 

 

 

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 2 Minuten schrieb Budspencer:

Ich bin mir nicht sicher was das System stören könnte, ein Stromausfall jedenfalls nicht, das regelt die USV.

Bei Stomausfall hat das Monitoring-System sowieso low prio, dann brennt es woanders 🙂

Die "guten Fragen" stelle ich nicht um dich zu ärgern, sondern damit du darüber nachdenkst und ich dir die Antworten nicht vor die Füße lege. Es handelt sich noch immer um dein Projekt, daher halte ich die Antworten sehr allgemein gefasst. 

vor 1 Minute schrieb Budspencer:

Ich denke die abfrage per ping und curl sollte reichen um sicher zu gehen dass der Server up ist und der Dienst läuft.

Jain.

Das Ganze mag ein bisschen tief für das Projekt gehen, aber wie gesagt: 
- Der Ping garantiert nicht die generelle Funktion des Servers
- Die Abfrage einer URL kann funktionieren, unabhängig ob das Webinterface nutzbar ist oder 301,302,403,404,504 etc. angezeigt wird. Nagios beispielsweise kann funktionieren, auch wenn der HTTP-Dienst Problemchen besitzt. 

vor 2 Stunden schrieb Budspencer:

"Können Sie sich auf den Monitoring-Server verlassen? Wie stellen Sie sicher das dieser funktioniert, um seine Aufgabe die Überwachung wahrzunehmen"

Abstriche muss man machen, sonst ist man bei high availability und Clustern. Ich würde behaupten Monitoring in einem kleineren Umfeld besitzt nicht die priority eine 100% Uptime zu besitzen. Entsprechend wäre es wahrscheinlich klug eine kleine Versicherung einzubauen und wenn diese Fehl schlägt, dann ist es halt so und es entsprechend zu kommunizieren. 

Von meiner Seite aus viel Erfolg bei der weiteren Prüfung 🙂

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 14 Minuten schrieb Asura:

Bei Stomausfall hat das Monitoring-System sowieso low prio, dann brennt es woanders 🙂Die "guten Fragen" stelle ich nicht um dich zu ärgern, sondern damit du darüber nachdenkst und ich dir die Antworten nicht vor die Füße lege. Es handelt sich noch immer um dein Projekt, daher halte ich die Antworten sehr allgemein gefasst. Jain.

Ich meinte das "gute Fragen" dankend und positiv, es hat mir sehr geholfen.
Ich danke dir/euch. Ich weis die Zeit die Du in deine Posting investiert hast zu schätzen.

Bearbeitet von Budspencer
Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0

Noch ein anderer (nicht technischer) Gedanke: Du kannst dich dem Thema auch über das Risikomanagement nähern.

  • Risiko des Ausfalls des Monitoringsystems bewerten.
  • Kosten der Gegenmaßnahmen abschätzen.
  • Entscheidung treffen, ob das Risiko mitigiert oder bewusst getragen wird (= nix zusätzlich machen).

P.s.: Implizit ist ein Monitoringsystem schon ein Werkzeug, um Betriebsrisiken zu mitigieren 😉.

Link zu diesem Kommentar
Auf anderen Seiten teilen

  • 0
vor 1 Stunde schrieb Pixelfuchs:

Noch ein anderer (nicht technischer) Gedanke: Du kannst dich dem Thema auch über das Risikomanagement nähern.

  • Risiko des Ausfalls des Monitoringsystems bewerten.
  • Kosten der Gegenmaßnahmen abschätzen.
  • Entscheidung treffen, ob das Risiko mitigiert oder bewusst getragen wird (= nix zusätzlich machen).

P.s.: Implizit ist ein Monitoringsystem schon ein Werkzeug, um Betriebsrisiken zu mitigieren 😉.

 

Der Gedanke (Idee) ist sogar ziemlich gut.
In Kombination mit dem Monitoring System (Server) und auf dem NAS wo das ping/curl script läuft, eine gute Entscheidung. Ich danke damit lässt es sich die Frage gut erklären 🙂

 

Besten Dank an @Asura @Pixelfuchs  und der Polizei aus Springfield aka @Chief Wiggum

Bearbeitet von Budspencer
Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Diese Frage beantworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...