Zum Inhalt springen
Zurück zu Insights
Monitoring
Veröffentlicht am 2. Juli 2026
7 Min. Lesezeit

Netzwerk-Monitoring, das mitdenkt: Warum statische Schwellwerte Ausfälle verpassen

Florian Hödl

Projektleiter

> Kurzfassung: "Überwacht 24/7" heißt bei den meisten Anbietern ein Dashboard mit roten und grünen Punkten. Das reicht nicht. Ein starrer Schwellwert meldet einen Ausfall erst, wenn er schon passiert ist, erzeugt Fehlalarme und sieht die schleichende Verschlechterung nie kommen. Anexum betreibt über 200 Anschlüsse über Glasfaser, DSL, Standleitung und 5G. Damit "überwacht" mehr bedeutet als ein grünes Lämpchen, bauen wir unsere Monitoring-Intelligenz (intern ANXEngine) auf drei Fragen: Was passiert als Nächstes? Warum passiert es, ein Standort oder der ganze Carrier? Und was ist jetzt zu tun?

Warum "überwacht 24/7" bei den meisten Anbietern wenig aussagt

Fast jeder Managed-Service-Anbieter schreibt "24/7 Monitoring" auf die Website. In der Praxis steht dahinter oft ein simpler Test: Antwortet der Anschluss auf einen Ping? Liegt die Antwortzeit über X Millisekunden? Fällt der Signalpegel unter Y dBm? Reißt ein Wert die feste Grenze, geht ein Alarm los.

Dieses Modell hat drei bekannte Schwächen:

  • Es meldet zu spät. Ein fixer Schwellwert schlägt erst an, wenn der Anschluss bereits gestört ist. Der Kunde merkt den Ausfall zur selben Zeit wie das Monitoring.
  • Es meldet zu oft das Falsche. Abends steigt die Antwortzeit an vielen Anschlüssen, weil mehr Verkehr läuft. Ein starrer Grenzwert erzeugt in dieser Zeit Fehlalarme. Wer zu oft grundlos geweckt wird, nimmt den nächsten Alarm nicht mehr ernst.
  • Es sieht die schleichende Verschlechterung nicht. Eine Antenne, deren Signal über zwei Wochen langsam abfällt, bleibt unter jedem festen Schwellwert, bis sie es an einem Dienstagmorgen nicht mehr ist.

Was ist "normal" für genau diesen Anschluss?

Der Kern des Problems: Ein fester Schwellwert kennt nur eine Zahl, aber kein "normal". 40 Millisekunden Antwortzeit sind für einen Glasfaseranschluss ein Warnsignal und für einen 5G-Standort in ländlicher Lage ein guter Wert. Derselbe Grenzwert ist für den einen Anschluss zu scharf und für den anderen zu locker.

Statt einer Zahl für alle lernt ANXEngine, was für jeden einzelnen Anschluss zu jeder Tageszeit üblich ist. Ein Messwert wird erst dann zur Anomalie, wenn er von seinem eigenen Muster abweicht, nicht von einem Durchschnitt über hunderte verschiedener Standorte. So entsteht für jeden Anschluss ein eigenes Erwartungsband über den Tag.

In unserem eigenen Netz sehen wir diese Muster deutlich: Antwortzeiten steigen in den Abendstunden, in den frühen Morgenstunden gibt es an vielen Anschlüssen kurze Aussetzer durch Wartungs- und Backup-Fenster, und mobile Anschlüsse schwanken stärker als Glasfaser. Ein Monitoring, das diese Muster kennt, alarmiert nicht bei jedem erwartbaren Abendpeak und bemerkt dafür die Abweichung, die wirklich aus der Reihe fällt.

Ein Ausfall oder hundert? Die Frage nach der Ursache

Wenn morgens um drei zwanzig Anschlüsse gleichzeitig ausfallen, sind das im schwachen Monitoring zwanzig Alarme. Der Bereitschaftsdienst arbeitet sie einzeln ab und sucht an zwanzig Standorten nach einem lokalen Fehler, den es gar nicht gibt.

Meist ist die Ursache eine einzige: eine Störung beim Carrier. ANXEngine prüft deshalb bei jedem Ereignis nicht nur den einzelnen Anschluss, sondern die Ebene darüber:

  • Fallen überdurchschnittlich viele Anschlüsse desselben Carriers gleichzeitig aus? Dann ist es eine Carrier-Störung, ein Anruf beim Netzbetreiber und kein Technikereinsatz.
  • Betrifft es Anschlüsse derselben Region? Dann ist es vermutlich ein regionales Ereignis.
  • Weicht ein einzelner Anschluss von seinen Nachbarn ab? Dann liegt der Fehler wahrscheinlich vor Ort, an Antenne, Router oder Verkabelung.

Aus zwanzig Einzelmeldungen wird eine Aussage mit Richtung. Statt "zwanzig Standorte rot" steht dort "Carrier-Störung, zwanzig Standorte betroffen". Das entscheidet, wer den Anruf bekommt und wie schnell die Störung behoben ist.

Nicht jeder Alarm ist gleich wichtig

Ein Anschluss ist nicht wie der andere. Ein temporärer Baustellenanschluss und die Zentrale eines Handelsunternehmens mit fünfundvierzig Arbeitsplätzen dürfen nicht denselben Alarm auslösen. Gutes Monitoring gewichtet nach tatsächlicher Auswirkung: Wie kritisch ist der Standort, wie viele Menschen hängen daran, welches SLA gilt, und wie stark weicht der Wert vom Normalzustand ab.

So landet der Ausfall am Gold-SLA-Standort oben auf der Liste und das kurze Flackern am Nebenanschluss weiter unten. Beide bleiben sichtbar, aber in der richtigen Reihenfolge.

FrageStatisches Schwellwert-MonitoringKontextbasiertes Monitoring
Wann wird alarmiert?Wenn ein fester Grenzwert gerissen wirdWenn ein Anschluss von seinem eigenen Muster abweicht
Abendlicher VerkehrsanstiegFehlalarmAls normales Tagesmuster erkannt
Schleichende VerschlechterungUnsichtbar bis zum AusfallAls Abweichung vom Trend früh erkennbar
20 Anschlüsse fallen gleichzeitig aus20 Einzelalarme1 Meldung: Carrier-Störung, 20 betroffen
PriorisierungAlle Alarme gleichNach Standortkritikalität und SLA

Drei Fragen, die gutes Monitoring beantworten muss

Aus dieser Erfahrung ist die Struktur hinter ANXEngine entstanden. Sie beantwortet der Reihe nach drei Fragen:

1. Was passiert als Nächstes? Aus dem gelernten Muster eines Anschlusses lässt sich abschätzen, wohin ein Wert läuft. Ein Signal, das seit Stunden abfällt, ist ein Hinweis, bevor der Anschluss steht. Ziel ist Vorwarnzeit, nicht die Meldung im Moment des Ausfalls.

2. Warum passiert es? Die Korrelation über Carrier, Region und Technologie trennt die lokale Störung von der Netzstörung. Das ist der Unterschied zwischen "wir schicken einen Techniker" und "wir rufen den Netzbetreiber an".

3. Was ist zu tun? Ein Ereignis in Klartext: was betroffen ist, was die wahrscheinliche Ursache ist und welcher nächste Schritt Sinn ergibt. Ein Alarm ist erst dann nützlich, wenn klar ist, was er bedeutet.

Wo ANXEngine heute steht

ANXEngine ist unser eigenes System und wächst mit unserem Netz. Die Bausteine, die heute tragen, sind die anschlussindividuellen Erwartungsbänder und die Korrelation über Carrier und Region. Sie laufen gegen die Telemetrie unserer eigenen Anschlüsse. Die vorausschauende Ebene, also eine Störung ansagen, bevor sie eintritt, und die generative Ebene, das Ereignis in Klartext erklären, bauen und prüfen wir Schritt für Schritt.

Ein Grundsatz gilt dabei durchgehend: Wir veröffentlichen keine Kennzahl, die wir nicht an echten Daten belegen können. Ein Modell, dessen Vorteil sich im Testlauf nicht gegen die bestehenden Regeln beweist, geht nicht in Betrieb. Monitoring, das mitdenkt, ist eine Arbeit an der Genauigkeit, kein Schalter, den man umlegt.

Was das für Sie bedeutet

Für ein Unternehmen mit verteilten Standorten zählt am Ende nicht, wie viele Metriken ein Dashboard zeigt, sondern ob der richtige Alarm zur richtigen Zeit bei der richtigen Person landet. Genau das ist der Anspruch hinter der Zeile "überwacht 24/7" bei Anexum: weniger Fehlalarme, frühere Hinweise und eine klare Ansage, ob ein Standort oder ein ganzer Carrier das Problem ist.

Das Monitoring ist Teil von [Managed Connectivity](/services/managed-connectivity/): Beschaffung, Betrieb und Überwachung Ihrer Anschlüsse aus einer Hand, mit einem Ansprechpartner und einer Rechnung. [Sprechen wir über Ihre Standorte →](/kontakt/)

Häufig gestellte Fragen

Was bedeutet "24/7 Monitoring" bei Anexum konkret?

Es bedeutet die laufende Überwachung Ihrer Anschlüsse gegen ihr jeweils eigenes Normalverhalten, nicht gegen einen einzelnen festen Grenzwert. Anexum betreibt über 200 Anschlüsse über Glasfaser, DSL, Standleitung und 5G und wertet deren Telemetrie kontinuierlich aus, um Abweichungen früh zu erkennen und nach Ursache und Kritikalität einzuordnen.

Warum reichen feste Schwellwerte für Netzwerk-Monitoring nicht aus?

Ein fester Grenzwert kennt keinen Kontext. Er meldet den Ausfall erst, wenn er schon eingetreten ist, erzeugt Fehlalarme bei erwartbaren Mustern wie dem abendlichen Verkehrsanstieg und übersieht die langsame Verschlechterung, die unter der Grenze bleibt. Kontextbasiertes Monitoring vergleicht jeden Anschluss mit seinem eigenen Muster über den Tag.

Was ist ANXEngine?

ANXEngine ist die interne Monitoring-Intelligenz von Anexum. Sie lernt für jeden Anschluss ein Erwartungsband, korreliert Ereignisse über Carrier, Region und Technologie und ordnet Alarme nach tatsächlicher Auswirkung. Das System wächst mit dem Netz; Verbesserungen gehen erst in Betrieb, wenn sie sich an echten Daten gegen die bestehenden Regeln beweisen.

Wie unterscheidet ANXEngine eine Carrier-Störung von einem einzelnen Ausfall?

Bei jedem Ereignis wird die Ebene über dem einzelnen Anschluss geprüft. Fallen überdurchschnittlich viele Anschlüsse desselben Carriers oder derselben Region gleichzeitig aus, wird daraus eine Meldung statt vieler Einzelalarme. Weicht dagegen ein einzelner Anschluss von seinen Nachbarn ab, liegt der Fehler wahrscheinlich vor Ort.

Kostenlose Checkliste

Prüfen Sie Ihre IT-Infrastruktur
in sechs Bereichen

Netzwerk, IT-Sicherheit, Cloud-Readiness, Compliance, Kommunikation und Monitoring — über 90 Checkpunkte, strukturiert zum Abhaken. Name und E-Mail eintragen, der Download startet sofort. Kein Newsletter.

IT-Infrastruktur Checkliste (PDF, 10 Seiten)Sechs Bereiche, über 90 Checkpunkte: Netzwerk, Sicherheit, Cloud-Readiness, Compliance, Kommunikation und Monitoring.