Erlernen Sie effektive Incident-Eskalationen und verbessern Sie mit Best Practices Ihr Incident Management durch nützliche Tools wie Wissensdatenbanken und Prioritätenmatrizen.
Autor: Ralph Bockisch
Erstellung: 17.05.2024, letzte Änderung: 26.06.2024
Inhaltsverzeichnis
Den Incident-Eskalationsprozess richtig verstehen
Auswirkung und Dringlichkeit bestimmen - Priorität ermitteln
Die Rolle detaillierter Aufzeichnungen - Incident-Record
Incident-Prioritätenmatrix und Ressourcen
Das Incidentmanagement fällt für viele in die Kategorie: „muss gemacht werden, aber ich würde viel lieber an etwas anderem arbeiten“. Doch ein gutes Verständnis dafür, wie man Incidents adäquat eskaliert, ist von nicht unerheblicher Bedeutung. Reduziert Hindernisse im Incidentmanagement-Prozess und wirkt gegen Verwirrungen.
Der erste Schritt der Incidentbearbeitung ist eine kritische Selbstbewertung: „Kann ich die Störung direkt lösen?“ Falls die Antwort „nein“ lautet, sollte der Incident an jemanden weitergeleitet werden, der über das nötige Fachwissen verfügt oder die Entscheidungsgewalt hat, um weiterzuhelfen. Zudem gibt es Werkzeuge und Methoden, die die Wahrscheinlichkeit erhöhen, dass die Antwort auf diese Frage öfter „ja“ lautet. Beispielsweise ist eine gut gepflegte Wissensdatenbank ein wertvolles Hilfsmittel. Sie stellt erprobte Antworten bereit, die es ermöglichen, selbst unbekannte Probleme zu lösen. Der Einsatz des Shift-Left-Ansatzes kann ebenfalls den Austausch von Wissen fördern und die Effizienz steigern.
Ein weiterer wichtiger Aspekt ist die korrekte Einschätzung, an wen der Incident eskaliert werden sollte. Grundsätzlich gibt es zwei Hauptformen der Eskalation von Vorfällen: die hierarchische und die funktionale Eskalation.
Es ist essenziell, sowohl die Auswirkung als auch die Dringlichkeit des Incidents zu bestimmen. Falls das Problem dringend ist und keine Lösung in der Wissensdatenbank vorliegt, sollte der Incident schnellstmöglich an einen Fachexperten eskaliert werden. Eine Incident-Prioritätsmatrix, wie sie in ITIL - Schulungen gelehrt wird, hilft, die richtigen Prioritäten zu setzen und Missverständnisse bei der Eskalation zu vermeiden. Es ist wichtig, präzise anzugeben, wen der Incident betrifft (das ganze Unternehmen, einen Standort, eine Abteilung oder nur einen Melder) und wie gravierend die Arbeitsbeeinträchtigung ist (können die Betroffenen arbeiten, eingeschränkt arbeiten oder gar nicht mehr arbeiten?).
Zuletzt sollte bei der Eskalation oder auch Weitergabe des Incidents darauf geachtet werden, so viele unterstützende und detaillierte Aufzeichnungen wie möglich bereitzustellen. Am sinnvollsten ist es, wenn man ein Übergabeprotokoll mit der Zusammenfassung der bereits durchgeführten Maßnahmen oder eine Art Checkliste bereitstellt. Dies erleichtert den Übergabeprozess erheblich und stellt sicher, dass der Incident schnell und effizient weiterbearbeitet werden kann.
Ein weiterer wichtiger Aspekt im Incidentmanagement ist das Bestimmen von Auswirkung und der Dringlichkeit eines Incidents. Diese beiden Parameter bestimmen dann über eine Matrix die richtige Priorität des Vorfalls.
Wie dringend ein Incidents ist, ist aus der Sicht der Person, die ihn meldet, ganz klar. Sie sieht ihn aus ihrer ganz persönlichen Sicht. Einer ist eher emotional beteiligt und fühlt sich massiv gestört in dem, was er gerade vorhatte – ein anderer denkt, dass er sicher nicht der einzige mit einem Anliegen ist und dass der Helpdesk bestimmt noch mehr zu tun hat.
Damit sich die Priorität eines Vorfalls nicht aus der Wertung des Melders ergibt und seinen Fähigkeiten, seine Einschätzung weiterzugeben, stellt EcholoN den Benutzern eine Matrix aus Dringlichkeit und Auswirkung zur Verfügung. Diese hilft dabei, den Vorgang objektiv und sachlich zu bewerten und so eine angemessene Priorität zu ermitteln.
Die Dringlichkeit stellt die Bewertung dar, wie schnell ein Vorgang gelöst werden muss. Beeinträchtigt der Incident die Fähigkeit der betroffenen Personen, ihre Arbeit zu verrichten, und in welchem Maß? Inwieweit ist der Geschäftsbetrieb gestört? Wird der Ausfall immer größere Kreise ziehen, und das womöglich schnell? Was kann nicht gemacht werden, solange die Störung besteht?
Bei der Auswirkung handelt es sich um eine Einschätzung der Reichweite der Meldung. Wer ist von dem Incident betroffen? Das gesamte Unternehmen, ein spezifischer Standort, eine Abteilung oder nur ein einzelner Benutzer? Wie umfangreich ist die Störung, welcher (potentielle) Schaden geht von ihr aus? Droht uns ein Image-Schaden oder Vertragsstrafen?
Ein wichtiger Bestandteil des Incidentmanagements ist die gewissenhafte Dokumentation alle Arbeitsschritte. Wenn ein Incident eskaliert wird, sind die Aufzeichnungen von großer Bedeutung. Sie stellen sicher, dass alle relevanten Informationen vorhanden sind, um den Übergabeprozess zu erleichtern und die Bearbeitung des Incidents verlustfrei fortzusetzen.
Zunächst sollten möglichst viele Einzelheiten des Incidents auf dokumentiert werden. Dazu gehören die Umstände, unter denen die Störung auftrat, die betroffenen Systeme oder Anwendungen (CIs) sowie die ersten durchgeführten Maßnahmen. Eine detaillierte und präzise Dokumentation hilft dem nachfolgenden Bearbeiter, sich schneller in den Vorfall einzuarbeiten.
Auch die Kommunikation mit dem Anfrager und anderen beteiligten Parteien gehört in die vollständige Dokumentation (EMails, Chat-Verlauf und Telefonate) eines Vorfalls. Ebenfalls sind Hinweise und Verknüpfungen zu verwendeten Wissensdatenbanken-Artikeln, frühere Incidents oder ähnlichen Problemstellungen mit dem Incident zu relationieren.
Neben der unmittelbaren Problemlösung ist auch die langfristige Analyse und Verbesserung durch ausführliche Dokumentationen möglich. Durch die Analyse von Mustern und wiederkehrenden Problemen können proaktive Maßnahmen entwickelt werden, um künftige Incidents zu vermeiden. Regelmäßig Schulungen der Mitarbeiter stellt sicher, dass die Qualität der Aufzeichnungen hoch bleibt. Ein standardisiertes Vorgehen erleichtert die Zusammenarbeit und trägt zur Konsistenz und Transparenz innerhalb der Teams bei.
Der Swarming-Ansatz ist ein kollaborativer Ansatz zur Lösung von Problemen. Im Gegensatz zur üblichen Vorgehensweise, bei der ein Incident von einer Person bearbeitet wird, baut der Swarming-Ansatz auf den Vorteil der Zusammenarbeit. Der Incident wird direkt an ein Team von Experten weitergeleitet. Die Teamarbeit führt schneller zu einer Lösung, da verschiedene Kenntnisse und Perspektiven parallel eingebracht werden.
Ein wichtiger Bestandteil des Swarming ist die Kommunikation. Hierbei wird eine offene und regelmäßige Kommunikation innerhalb des Teams gefördert, um sicherzustellen, dass alle Mitglieder über denselben Informationsstand verfügen. Tools wie Instant Messaging, Videokonferenzen und spezielle Kollaborationsplattformen können diesen Prozess unterstützen und die Zusammenarbeit erleichtern.
Dieser Ansatz bringt mehrere Vorteile mit sich:
Durch den Einsatz moderner Kommunikationsmittel und klarer Prozesse kann dieser kollaborative Ansatz reibungslos in bestehende Incidentmanagement-Strukturen integriert werden.
Die Incident-Prioritätenmatrix ist ein wichtiges Werkzeug im Incidentmanagement. Es hilft dabei, den Schweregrad eines Incidents zu bewerten und ihm die richtige Priorität zu geben. Die Nutzung einer Prioritätenmatrix stellt sicher, dass Ressourcen effizient eingesetzt und Incidents entsprechend ihrer Schwere und ihrem Einfluss auf den Geschäftsbetrieb bearbeitet werden.
Durch die Kreuzung von Dringlichkeit und Auswirkung in der Matrix können Incidents klar priorisiert werden. Beispielsweise bedeutet ein Incident mit hoher Auswirkung und hoher Dringlichkeit eine sehr hohe Priorität und muss unmittelbar bearbeitet werden, während einer mit niedriger Auswirkung und Dringlichkeit eine geringere Priorität hat.
Die Nutzung einer solchen Matrix bietet folgende Vorteile:
Folgende Ressourcen sollten zur Verfügung stehen:
Externe Ressourcen wie Schulungen nach ITIL-Standard bieten fundiertes Wissen und sind ebenfalls eine wertvolle Ressource zur Verbesserung der Fähigkeiten Ihres Teams. Zudem gibt es spezialisierte Softwarelösungen, die die Incident-Priorisierung und Bearbeitung optimieren können. Tools wie EcholoN bieten erweiterte Funktionen zur Incidentverfolgung, Ressourcenverwaltung und Unterstützung bei der richtigen Eskalation.